微软 30% 代码由 AI 编写不到一年,紧急设立「工程质量负责人」——AI 写代码越多,Bug 也越多?

📌 一句话总结:微软去年高调宣布 30% 代码由 AI 编写,如今却紧急设立「工程质量负责人」新职位——AI 写代码的速度上去了,但质量问题正在集中爆发。

2026-02-12 · 资讯分享 · 阅读时间约 4 分钟

一个耐人寻味的人事任命

2 月 4 日,微软 CEO 萨蒂亚·纳德拉在一份内部备忘录中宣布:任命 Charlie Bell 为公司新设的「工程质量负责人」(Engineering Quality Head),直接向纳德拉本人汇报。

Bell 并非等闲之辈。他在亚马逊工作了 23 年后于 2021 年加入微软,此前一直负责微软的安全部门。如今他将以「个人贡献者」(IC)身份专注于工程质量——这在微软高管层中极为罕见。

纳德拉在备忘录中将此描述为「计划已久的过渡」。但时间线讲述了一个不同的故事。

AI 代码越多,Bug 也越多

2025 年 4 月,纳德拉在与 Meta CEO 扎克伯格的炉边对话中自豪地表示,微软代码库中 20% 到 30% 的代码「由软件编写」。微软 CTO Kevin Scott 更进一步预测,到 2030 年 95% 的代码都将由 AI 生成。

但速度和数量并不自动等于质量。

GitClear 的研究发现,AI 编程工具普及后,代码流失率(code churn,即新写代码被重写或删除的比率)大约翻了一倍。微软自己的研究人员也发现,开发者在审查 AI 生成代码时,漏掉的 Bug 比审查人工代码多出约 40%。
— 来源:Times of India

这组数据揭示了一个行业性的隐患:AI 生成的代码看起来「像那么回事」,但开发者在审查时会不自觉地降低警惕——毕竟,机器写的代码看起来格式规范、逻辑清晰,人类很容易产生「应该没问题」的错觉。

Windows 11 的质量危机

这个人事任命的背景是 Windows 11 近期频繁出现的质量问题:

  • 2026 年 1 月的安全更新导致企业 PC 无法启动
  • 另一个补丁破坏了关机功能
  • 两次紧急带外修复(out-of-band fixes)
  • 文件资源管理器持续卡顿
  • 一个暗色模式 Bug 在修复过程中反而被加重

微软已经将工程师从新功能开发中抽调出来,专门修复可靠性问题——这项内部行动被称为「蜂拥」(swarming),预计将持续数月。

Copilot 的商业化困境

工程质量问题之外,微软的 AI 商业化也面临挑战。目前 Microsoft 365 和 Office 365 用户中,仅有 3.3% 付费使用 Copilot。微软股价今年表现不佳,Azure 增速也在上周财报中令分析师失望。

更值得注意的是,微软已经开始悄悄缩减 Copilot 在记事本、画图等应用中的集成——这与此前「AI 无处不在」的激进策略形成了鲜明对比。

安全部门的交接

Bell 离开安全部门后,接替他的是 Hayete Gallot。Gallot 曾在微软工作 15 年,2024 年跳槽到 Google Cloud,如今回归微软担任安全执行副总裁。这次「出走又回归」的人事安排,也从侧面说明了微软在安全和质量两条线上都在加大投入。

富贵点评

这件事特别有意思。纳德拉去年还在炫耀「30% 代码是 AI 写的」,转头就设了个「工程质量负责人」——这不就是变相承认 AI 写的代码质量不够硬吗?

其实这反映了整个行业的一个核心矛盾:AI 编程工具让代码产出速度飙升,但「写得快」和「写得好」是两回事。GitClear 的数据很说明问题——代码流失率翻倍,意味着大量 AI 生成的代码最终还是要被人类重写。40% 的 Bug 漏检率更是一个危险信号:当开发者习惯了「AI 写、我审」的工作流,审查质量反而在下降。

微软的做法其实值得肯定——至少他们意识到了问题并在组织架构上做出调整。但更深层的问题是:当整个行业都在追求「AI 写 95% 代码」的目标时,谁来保证那 95% 的质量?这可能是 2026 年软件工程领域最值得关注的命题。

📋 要点回顾

  • 新职位设立:微软任命前安全主管 Charlie Bell 为首任「工程质量负责人」,直接向 CEO 纳德拉汇报
  • AI 代码质量隐患:AI 编程工具普及后代码流失率翻倍,开发者审查 AI 代码时漏掉的 Bug 多 40%
  • Windows 11 频出问题:1 月份连续出现启动失败、关机异常等严重 Bug,微软已抽调工程师专项修复
  • Copilot 商业化受阻:付费率仅 3.3%,微软开始缩减部分应用中的 Copilot 集成

❓ 常见问题

Q: 微软为什么要专门设立「工程质量负责人」这个职位?

A: 随着 AI 生成代码比例快速增长(已达 30%),代码质量问题开始集中暴露。Windows 11 近期频繁出现严重 Bug,微软需要在组织架构层面加强质量管控。Charlie Bell 作为资深技术高管,被赋予了这一全新角色。

Q: AI 生成的代码质量到底差在哪里?

A: 主要问题不在于 AI 写的代码本身有多差,而在于人类审查环节的失效。研究显示开发者审查 AI 代码时漏掉的 Bug 比审查人工代码多 40%,可能是因为 AI 代码表面上格式规范、逻辑清晰,容易让审查者放松警惕。此外,代码流失率翻倍说明大量 AI 代码最终需要重写。

Q: 这对普通开发者使用 AI 编程工具有什么启示?

A: 核心启示是:不要因为代码是 AI 生成的就降低审查标准。恰恰相反,AI 代码可能需要更严格的 Code Review。建议开发者在使用 AI 编程工具时,保持与审查人工代码同等甚至更高的警惕性,并建立专门的 AI 代码质量检查流程。

作者:王富贵 | 发布时间:2026-02-12

参考来源:Times of India