译文信息
- 原文:How to scale agentic coding across your engineering organization
- 作者:Anthropic
- 原文发布:2025-10-15
- 翻译发布:2026-03-25(东八区)
随着 agentic coding 工具走向成熟,技术负责人面临一个现实问题:如何从零星试点,推进到全组织范围的采用。
成败往往取决于执行方式。认真部署 agentic coding 的团队,通常能在开发速度与工程师满意度上看到实质提升;仓促上线、缺乏规划则容易遇到抵触、结果参差不齐,也难以向各方证明价值。
与不同行业的工程团队共事时,一些共性模式逐渐清晰:能否成功采纳,较少取决于具体工具,更多取决于你如何调整工作流、培养技能、处理团队关系,以及如何衡量成功。
下面分块说明。
理解 agentic coding 的能力边界
与基础的代码补全相比,agentic coding 工具能理解更广的上下文,并处理多步骤任务。它们可以规划方案、推进实现细节,比早期 AI 编程助手更少依赖一步步人工喂指令。
常见用途包括:
遗留系统现代化:团队借助这类工具,把旧代码库迁到当前平台。原本可能以年计的项目可以加快,但仍需严格把关与测试,才能正确保留业务逻辑。
更快上手:新人可以直接向代码库提问,理解架构、依赖与实现模式。这是对传统文档的补充,能缩短从入职到有效产出的时间。
事故响应辅助:SRE 与 DevOps 团队可以搭建 agent,协助诊断和处理常见运维问题。复杂问题仍需要人工,但常规事故往往可以减少手工介入。
更广的技术参与面:产品经理在写需求时可以探索代码约束;设计师可以从设计稿做出可运行的原型。这不能替代工程工作,但能让跨职能协作更有的放矢。
以上只是起点,并非 agentic coding 应用场景的穷举。
规划扩展路径
有效的推广要在速度与学习之间找平衡。成功的组织往往不会「一次性全员放开」,也不会把试点拖成漫长阶段,而是在保持动能的同时,逐步积累专长。
从超级用户开始
先圈定 20~50 名已经在用 AI 辅助工具的开发者做试点。这一组可以:在你们的代码库上验证技术、摸索有用工作流,并培养后续推广所需的内部能力。
给试点组时间在常见场景里做实验——亲身经历才能判断哪些定制有价值、工具与现有系统接得是否顺畅。请他们记录发现的模式:哪些有效、哪些无效。
可落地的试点活动包括:
- 为数据库迁移、功能脚手架等常见任务编写自定义 slash command
- 编写
CLAUDE.md,沉淀编码规范与项目专属上下文 - 找出值得自动化的重复工作流(样板代码、测试生成、依赖更新等)
- 建立专门频道,用于排障与知识共享
- 为第三方工具认证编写封装脚本
试点阶段应在更大范围开放权限之前,同时暴露机会与风险。
用黑客松启动
若不想采用「各团队排队等权限」的分阶段 rollout,也可以考虑用一场启动活动把组织拉在一起:试点用户分享技巧与 prompt,所有人同时动手尝试。
这种形式能在低风险环境里展示能力。对 AI 辅助持怀疑态度的工程师,往往在亲自试过之后会改观;协作氛围也容易催生试点组未曾想到的创新用法。
尽量让活动门槛低、有能量——餐饮对出勤和士气都有帮助。
靠内部专长放大规模
使用人数上升后,试点组可以转为顾问角色:办工作坊、做教育内容、在别人卡壳时提供帮助。
这通常比纯外部培训更有效,因为内部 champion 熟悉你们的真实环境,能举本仓库、本项目的例子,说你们组织里听得懂的话,也知道你们特有的痛点。
用好 CLAUDE.md
CLAUDE.md 用于记录仓库约定、环境搭建与项目专属行为。当团队在全组织范围内系统共享时,价值会明显放大。
在项目根目录维护一份:把 CLAUDE.md 提交进仓库根路径,确保所有在该项目上工作的人自动继承同一套配置与上下文。
像文档一样维护:架构决策变更或新模式出现时更新 CLAUDE.md;这些更新应随代码改动一起进入 pull request。
纳入入职清单:新人 onboarding 时要求阅读项目的 CLAUDE.md,既要懂代码库,也要懂在该语境下如何用 Claude Code。
分支差异大时考虑分支级说明:若不同分支上的模式差异很大,可为各分支维护能反映当下语境的 CLAUDE.md 内容。
典型的项目级文件可涵盖:开发环境要求、测试与代码规范、关键架构模式、当前工作重点等。这样形成活文档,让 Claude Code 与你们不断演进的实践保持一致。
衡量影响
试点需要清晰的成功标准。「ROI 怎么算?」仍是推动超越早期爱好者之外采纳的核心问题。
除了「写了多少行代码」(能反映活跃度,未必反映价值),团队还会跟踪多种指标:
Sprint 吞吐:已有成熟 DevOps 实践的团队,可以把采纳时间与功能交付速度的变化关联起来。
任务完成耗时:对比实施前后,标准任务各需多久。粒度更细,才能看出 agentic coding 在哪些环节贡献最大。
迁移速度:跟踪现代化遗留系统所需时间。迁移越快,越能腾出工程资源做其他事。
开发者满意度:调研工程师在重复劳动与创造性工作上的时间分配。满意度与留存、产出都相关。
上手周期:衡量新人达到有效产出的速度。爬坡越短,培训成本越低、团队容量越早释放。
跨职能效率:统计其他团队为原型与测试而依赖专属工程支持的频率。依赖下降,往往说明更广的技术能力在提升。
Claude Code 提供 Activity Metrics,可跟踪已采纳代码行数、建议采纳率、日活用户与会话、组织级与按人支出,以及个人开发者指标。
有时最有说服力的反而是最简单的:具体任务现在只要过去几分之一的时间。当你能举出明确、有意义的效率提升例子时,价值往往不言自明。
常见采纳障碍
在 agentic coding 推广过程中,几类问题会反复出现。提前应对能改善结果。
把任务范围划清楚
新用户有时会给 agent 过于宏大、上下文又不足的任务,结果令人沮丧。**测试驱动开发(TDD)**能提供结构和清晰的成功标准。
先写测试,定义什么叫成功:必需功能、边界情况、错误处理。再增量实现——每次只写够让一个测试通过的代码。以认证为例:可以先做基础登录校验,再加密码哈希,再加会话管理。
每步之后跑测试,并在继续扩大范围之前审阅改动。Claude Code 可以帮忙分析测试结果,但要等当前功能稳定后再加新需求。
通过「先写测试、再实现到通过」逐步追加需求,能抑制范围蔓延、守住质量。
使用聚焦的指令,例如先「为用户注册写测试」,再「实现注册逻辑使这些测试通过」,而不是一次性要求全部做完。
提供足够上下文
像「这不行」或「按钮太大」这类模糊描述,很难让 AI 有效帮忙。请尽量具体:
分享完整错误信息——完整报错、堆栈,以及触发问题的具体操作。可直接把终端输出或浏览器控制台错误贴进会话。
说明运行环境:操作系统、语言版本、框架与相关依赖。缺少这些信息,方案容易跑偏。
对 UI 问题,可附截图并精确描述哪里不对:例如「登录按钮在移动端比容器右边界多出约 20 像素」,而不是「按钮看起来很怪」。
把期望行为与实际行为写清楚:例如「期望:API 返回 200 与用户数据;实际:返回 401,消息为 invalid token」。
附上相关文件内容——与问题直接相关的代码、配置或数据。
养成有效的提示习惯
与 AI 工具清晰沟通需要练习。不少人期待「读心式」一次到位,结果不如意就受挫。
可以自问:如果问的是同事,对方能听懂吗? 若不能,就把对方会追问的信息提前给出。
先写高层目标,再补实现细节。例如先说「搭建用户管理的 REST API」,再列端点与具体要求,通常比把所有信息搅在一起更好。
用明确的技术表述替代含糊说法。「把数据库查询优化到响应时间从 2 秒降到 500 毫秒以内」优于「弄快一点」。
用具体例子说明什么叫做好:「按这个既有 API 模式来写 [粘贴代码]」或「按这份风格指南 [分享链接]」,比抽象需求更清晰。
把复杂工作拆成顺序清晰的多条 prompt:「创建数据库表结构」→「实现商品目录 API」→「加购物车功能」,每条只聚焦一个明确目标。
从简单开始、迭代细化。「先做一个基础登录表单」→「加输入校验」→「实现密码强度规则」,往往比一次性写满所有细节更稳。
对输出给具体反馈:「错误处理太泛——请为邮箱格式和密码长度增加专门校验」比只说「把校验修好」更有用。
在接续前序工作时显式引用:例如「用前面写的认证中间件,现在加上基于角色的权限」。
向前推进
agentic coding 把软件开发从「逐行手写」转向「引导实现」。效果好的组织,重心放在打地基,而不是抢跑式部署。
从聚焦的试点组开始;培养内部专长;搭建支撑成功的机制;再通过黑客松、内部 champion 等方式有节奏地扩大。
从试点到生产级使用需要耐心与系统规划。在这块投入的组织,往往能看到实实在在的回报:开发更快、工程师更满意,以及有能力承接过去很难啃动的项目。
常见问题(节选)
- 如何开始使用 Claude Code? 需要配置 API key,并按官方文档完成接入,以便正确发起请求并处理响应。
- agentic coding 工具能自主运行多久? 取决于任务复杂度与项目要求;例如 Rakuten 曾有一次约七小时的自主重构会话,说明在合适条件下可以长时间保持上下文并连续推进技术工作。
- 是否必须改变开发工作流? Claude Code 通过终端集成融入现有流程;可以从小处开始(测试、文档),再逐步扩展到完整功能开发。
译文转自 Claude Blog,版权归原作者与 Anthropic 所有。
评论
使用 GitHub 账号登录后即可发表评论,评论会同步到仓库 Discussions。