📌 一句话总结:支付巨头 Stripe 公开其内部 AI 编码代理系统「Minions」的技术细节——这些全自动代理每周独立完成并合并超过 1300 个 Pull Request,代码从编写到测试全程无人干预,但每一行最终仍由人类工程师审核把关。
2026年2月20日 · AI资讯 · 阅读时间约 4 分钟
从辅助工具到独立开发者
当大多数公司还在讨论 AI 编程助手能不能替代 Copilot 的自动补全时,Stripe 已经悄悄走到了另一个阶段:让 AI 独立完成从零到一的完整开发流程。
2 月 19 日,Stripe 在其工程博客发布了「Minions」系列文章的第二部分,详细披露了这套内部 AI 编码代理系统的架构和运行数据。根据 Stripe 的说法,Minions 是「完全无人值守的 AI 编码代理」(fully unattended AI coding agents)——接到任务后,它们能独立编写代码、运行测试、修复常见问题,最终提交一个完整的 Pull Request。
关键数据:每周超过 1300 个由 Minions 完全编写的 PR 被合并进 Stripe 的代码库。这些 PR 中没有一行是人类写的,但每一个都经过了人类工程师的代码审查。
技术架构:Devbox + Blueprints
Minions 的运行环境是 Stripe 内部的标准开发环境「Devbox」——一种基于云的隔离开发空间,包含 Stripe 的完整代码库和工具链。这套环境原本是为人类工程师设计的,但事实证明它同样适合 AI 代理使用。
由于每个 Devbox 都是隔离的且可以随时销毁重建,Minions 可以在其中拥有完整的 Shell 权限,无需逐步确认操作——因为任何错误都被限制在单个沙箱内,不会影响生产环境或接触真实客户数据。
据报道,Minions 的代理框架是基于 Block(原 Square)开源的编码代理 Goose 的深度修改版本,专门针对无人值守场景进行了优化。系统的核心是一套叫做「Blueprints」(蓝图)的编排机制——它将确定性的代码节点(如运行 linter、推送代码)与开放式的 AI 决策循环混合在一起,在可预测性和灵活性之间取得平衡。
人类工程师的角色转变
尽管 Minions 能端到端地完成任务,Stripe 强调人类仍然牢牢掌控着最终决策权。每个 AI 生成的 PR 都必须经过工程师审查,与人类编写的代码遵循完全相同的流程。
Stripe 指出,AI 擅长按照指令执行和修复已知问题,但在长期系统设计、安全风险评估和意外边界情况处理方面,人类判断仍然不可替代。为了控制成本和防止 AI 陷入无限循环,Minions 通常只有一到两次修复失败测试的机会,超出后任务会被交还给人类。
为什么 Stripe 能做到
Stripe 认为,多年来在开发者生产力工具上的投资是他们能快速、安全地采用 AI 编码代理的关键原因。标准化的开发环境、完善的 CI/CD 流水线、严格的代码审查文化——这些为人类工程师打造的基础设施,恰好成为了 AI 代理最好的运行平台。
AI 在已有良好开发者工具和系统的基础上运行效果最好。为人类开发者所做的投资,现在正在帮助公司更快、更安全地采用 AI。
— 来源:Stripe Engineering Blog
富贵点评
Stripe 这次公开 Minions 的细节,最有价值的不是「每周 1300 个 PR」这个数字本身,而是它揭示的一个趋势:AI 编码正在从「辅助补全」快速演进到「独立交付」。
但仔细看会发现一个有意思的悖论——AI 写了所有代码,人类审查了所有代码。这意味着工程师的角色正在从「写代码的人」变成「审代码的人」。这对工程师的能力要求其实更高了:你不再需要手速快,但你必须能看懂别人(或者说别的东西)写的代码,判断它是否正确、安全、可维护。
另一个值得注意的点是 Stripe 选择基于 Block 的开源项目 Goose 来构建,而不是从零开始。这说明在 AI 编码代理领域,开源生态正在成为企业级应用的起点。未来可能会看到更多大厂基于开源代理框架构建自己的内部系统,而不是等待某个商业产品来解决所有问题。
📋 要点回顾
- 规模化产出:Stripe 的 Minions 每周自动合并超过 1300 个 PR,代码完全由 AI 从头编写,无人类参与编码环节
- 沙箱隔离:每个 Minion 运行在独立的 Devbox 中,拥有完整 Shell 权限但与生产环境完全隔离
- 蓝图编排:通过 Blueprints 机制混合确定性步骤和 AI 自主决策,平衡可靠性与灵活性
- 人类审核不变:所有 AI 生成的代码仍需通过人类工程师的代码审查才能合并
- 开源基因:系统基于 Block 开源的 Goose 代理框架深度定制,而非从零构建
❓ 常见问题
Q: Stripe 的 Minions 和 GitHub Copilot 有什么区别?
A: Copilot 主要是实时代码补全工具,需要开发者在编辑器中逐步引导。Minions 则是完全自主的编码代理,接到任务后能独立完成从编写代码到提交 PR 的全流程,无需人类在过程中干预。
Q: AI 写的代码质量如何保证?
A: Stripe 采用双重保障:首先 Minions 会自动运行测试和 linter 检查;其次所有 AI 生成的 PR 都必须经过人类工程师的代码审查,与人类编写的代码遵循完全相同的审核标准。
Q: 这是否意味着 Stripe 在裁减工程师?
A: Stripe 并未表示会因此减少工程师数量。相反,工程师的角色正在转变——从编写代码转向审查代码、系统设计和处理 AI 无法胜任的复杂决策。AI 处理的更多是重复性和模式化的编码任务。
作者:王富贵 | 发布时间:2026年2月20日