Spotify 顶级开发者自去年 12 月起未写一行代码:当「Vibe Coding」从实验变成生产力标配,软件工程的下一章会怎么写?

📌 一句话总结:Spotify 最资深工程师自 2025 年 12 月起未手写一行代码,全部由内部 AI 系统 Honk 生成——研发费用降了 23%,股价涨了 15%,但 AI 生成代码 45% 存在安全漏洞,工程师「AI 疲劳」正在蔓延。这场实验的结局,可能比财报数字复杂得多。

2026年2月15日 · 深度解读 · 阅读时间约 8 分钟

发生了什么

2026 年 2 月 10 日,Spotify Q4 2025 财报电话会上,联席 CEO 兼 CTO Gustav Söderström 说了一句让整个科技圈炸锅的话:

「当我和我们最资深的工程师——我们最好的开发者——交谈时,他们说自己从 12 月起就没写过一行代码了。他们只生成代码,然后监督它。」
— 来源:Business Insider

这不是某个创业公司的 Demo Day 演讲,而是一家拥有 7.51 亿月活用户、市值数百亿美元的上市公司,在面向投资者的正式场合做出的声明。

背后的系统叫 Honk,基于 Anthropic 的 Claude Code 构建。据 Söderström 描述,一个 Spotify 工程师在上班通勤的地铁上,可以通过 Slack 在手机上指示 AI 修复一个 Bug 或给 iOS 应用添加新功能,AI 完成后会把新版本推送回 Slack,工程师在到达办公室之前就能把代码合并到生产环境。

Honk 目前每月合并超过 650 个 AI 生成的 Pull Request。触发这一转变的关键节点是 2025 年圣诞节期间 Anthropic 发布的 Claude Opus 4.5——在那之后,Spotify 不再把 AI 编程当作实验,而是当作默认工作方式。

财报数字很漂亮,但故事不止于此

从投资者的角度看,这是一个完美的叙事:

指标数据
Q4 营收€45.3 亿,同比增长 13%
全年营收€172 亿
全年利润€22 亿
Q4 研发费用€2.9 亿,同比下降 23%
财报日股价涨幅+15%

研发费用下降 23%,利润创新高,股价暴涨——华尔街爱听这种故事。但如果你把镜头拉远一点,画面就没那么光鲜了。

Spotify 在 2023-2024 年间经历了三轮大裁员,总计削减约 3,700 个岗位,员工总数从峰值约 9,800 人降至 7,000-7,200 人。CEO Daniel Ek 自己承认裁员「对运营的干扰超出预期」。

与此同时,订阅价格在两年半内从 $9.99 涨到 $12.99,涨幅 30%。每次播放的版税费率维持在 $0.003-$0.005。2024 年起,年播放量低于 1,000 次的艺术家不再获得任何报酬,约三分之二的平台艺术家被「去货币化」。

研发费用降了 23%,价格涨了 30%,版税费率是 $0.003。省下来的钱没有流向艺术家。

AI 生成代码的质量问题:房间里的大象

Söderström 在财报会上大谈效率,但有一个话题他完全没提:代码质量。

就在 Spotify 财报会的六天前,微软 CEO Satya Nadella 刚刚任命 Charlie Bell 担任新的工程质量负责人。背景是:Azure 频繁宕机、质量问题日益严重,而微软估计有 20-30% 的代码由 AI 生成。

微软在 AI 代码占比 20-30% 时就需要一个「质量沙皇」。Spotify 声称其顶级工程师 100% 不手写代码,却没有宣布任何类似的质量保障措施。

学术研究和行业报告的结论是一致的,而且不太乐观:

来源发现
Veracode(2025.7)45% 的 AI 生成代码包含安全漏洞
arXiv 研究(2025.10)分析 7,703 个 AI 生成文件,发现 4,241 个 CWE 漏洞实例
斯坦福大学(2023)使用 AI 辅助的开发者写出更不安全的代码,但自认为更安全
GitClearAI 密集型代码库的代码流失率增加 39%
Apiiro(2025.9)报告标题:「4 倍速度,10 倍漏洞」

斯坦福的发现尤其值得注意:开发者使用 AI 后不仅写出了更不安全的代码,还对代码安全性产生了更高的自信。这种「自信-能力」的反向关系,在心理学上有个名字叫邓宁-克鲁格效应。

Spotify 有 7.51 亿月活用户。他们现在是这场实验的测试组。

「AI 疲劳」:被忽视的另一面

就在 Spotify 财报会的同一周,软件工程师 Siddhant Khare 发表了一篇病毒式传播的文章,标题是《AI 疲劳是真实的,但没人谈论它》。

「每次都感觉你是流水线上的一个审核员,而那条流水线永远不会停下来,你只是不停地在那些 PR 上盖章。」
— 来源:Siddhant Khare via Business Insider

AI 疲劳不是讨厌 AI。它是一种新的工作现实:工程师不再需要写代码,但需要以一种可能不可持续的速度审查和修复 AI 生成的代码。

想象一下:以前你是一个厨师,从选材到烹饪到摆盘,整个过程你都参与。现在你变成了一个品控员,面前有一条永不停歇的传送带,上面是 AI 做的菜,你要在几秒内判断每道菜能不能端给客人。

产出确实更多了。但你和「做菜」这件事之间的关系,已经完全不同了。

另一位工程师 Steve Yegge 更直接:他认为在 AI 编程时代,公司应该只期望工程师每天有效工作 3 小时——因为审查 AI 代码的认知负荷远超手写代码。

Spotify 的产品质量:一面不太好看的镜子

如果 AI 编程真的如 Söderström 所说那么好,Spotify 的产品应该越来越好才对。但现实是:

2025 年 10 月,Android 应用在 Wi-Fi 连接时频繁冻结。11 月,播客功能出现崩溃 Bug。12 月,用户在 Reddit 上报告应用「又崩了」。macOS 客户端被用户形容为「一具尸体,冰冷地在时间中腐烂」。

2024 年的 Wrapped 年度回顾以 AI 生成的播客为核心,用户评价是「尴尬」「千篇一律」「没有灵魂」。2021 年宣布的无损音频功能,五年后仍未上线——而 Apple Music、Amazon Music、Tidal、Deezer 早已支持。

推荐系统的设计者 Glenn McDonald 在 2023 年被裁员后,他的人工引导分类系统被纯机器学习取代。他的评价是:「这客观上更差了。」用户也注意到了——有人的 Release Radar 里 85% 是雨声和自然音效。

更深层的问题:当写代码的公司不再相信人写的东西

音乐行业媒体 Complete Music Update(CMU)在财报会后提出了一个尖锐的问题:

当一家公司的工程团队不再写代码,当它认定人写的代码不如机器生成的代码高效——它凭什么会对人写的音乐有不同的看法?
— 来源:Complete Music Update via Reading.sh

Spotify 最近宣布支持「衍生作品」,包括 AI 生成的粉丝混音和翻唱。竞争对手 Deezer 报告称每天有 6 万首完全由 AI 生成的曲目上传到其平台,占总上传量的 39%。Spotify 被问到同等数据时,拒绝分享。

CMU 的评论是:「如果这个数字很小,他会说的。」

一家认定人写代码已经过时的公司,现在掌握着人写音乐的付费规则。每次播放 $0.003。

IBM 的反向操作:一个有趣的对照

就在同一周,IBM 宣布将在 2026 年把入门级招聘规模扩大三倍。CHRO Nickle LaMoreaux 说:「是的,这包括软件开发者和所有那些我们被告知 AI 可以做的工作。」

IBM 的逻辑是:虽然 AI 可以自动化很多入门级任务,但砍掉初级岗位会在几年后造成中层管理人才断层。他们选择重新设计岗位职责——减少常规编码,增加客户互动和 AI 监督——而不是直接用 AI 替代人。

Dropbox 的首席人力官 Melanie Rosenwasser 的比喻很生动:「Z 世代就像在环法自行车赛上骑车,而我们其他人还在用辅助轮。」

Spotify 和 IBM 代表了两种截然不同的路线:一个在用 AI 替代人写代码,一个在用 AI 重新定义人的工作。三到五年后,哪种路线更可持续,市场会给出答案。

富贵点评

Söderström 在财报会上说了一个词:「epiphany」(顿悟)。他说圣诞节和 Claude Opus 4.5 待了几天后,回来就觉得一切都变了。

科技圈有人开始把这种现象叫「LLM 精神病」——AI 工具产出看起来合理、自信的结果,使用者逐渐停止质疑。输出看起来对,速度感觉对,审计就慢慢消失了。

我不怀疑 AI 编程的效率提升是真实的。但效率和质量不是同一件事,速度和可持续性也不是。Spotify 的故事之所以重要,不是因为它证明了 AI 编程有多好或多坏,而是因为它是第一个在这个规模上「全押」的案例。7.51 亿用户,研发费用降 23%,顶级工程师零手写代码。

如果成功了,它会成为每个 CEO 在董事会上引用的案例。如果出了问题——比如一个安全漏洞影响了几亿用户——它会成为每个工程管理教科书里的反面教材。

无论哪种结果,软件工程这个职业的定义,正在被重写。而重写它的,不是工程师自己。

📋 要点回顾

  • Honk 系统:基于 Anthropic Claude Code 构建,每月合并 650+ 个 AI 生成的 PR,Spotify 最资深工程师自 2025 年 12 月起完全通过提示词生成代码
  • 财务影响:Q4 研发费用同比降 23% 至 €2.9 亿,全年利润 €22 亿,财报日股价涨 15%
  • 安全隐患:多项研究显示 AI 生成代码 45% 存在安全漏洞,代码流失率增加 39%,开发者使用 AI 后对代码安全性过度自信
  • AI 疲劳:工程师从「写代码」变成「审代码」,认知负荷模式根本性改变,可持续性存疑
  • 行业分歧:Spotify 用 AI 替代人写代码,IBM 同周宣布入门级招聘扩大三倍——两种路线的长期结果尚待验证

❓ 常见问题

Q: Spotify 的 Honk 系统具体是什么?

A: Honk 是 Spotify 基于 Anthropic 的 Claude Code 构建的内部 AI 编程系统。工程师可以通过 Slack 用自然语言描述需求,Honk 会自动生成代码、创建 Pull Request,工程师审核后即可合并到生产环境。目前每月处理超过 650 个 AI 生成的 PR。

Q: AI 生成的代码真的不安全吗?

A: 多项独立研究表明存在显著风险。Veracode 发现 45% 的 AI 生成代码包含安全漏洞,斯坦福研究发现使用 AI 的开发者写出更不安全的代码但自认为更安全。不过这些是统计数据,具体到 Spotify 的实际安全状况,外界目前无法评估。

Q: 这是否意味着程序员要失业了?

A: 不完全是。Spotify 的案例显示的是角色转变而非消失——工程师从「写代码的人」变成「监督 AI 写代码的人」。IBM 同周宣布扩大入门级招聘三倍,说明行业对此并无共识。更准确的说法是:「程序员」这个职业的定义正在被重新书写。

Q: 什么是「AI 疲劳」?

A: AI 疲劳是指工程师因持续审查大量 AI 生成代码而产生的精神疲惫。它不是对 AI 的抵触,而是一种新的职业倦怠形式——当你的工作从创造变成审核,从主动编写变成被动盖章,认知负荷的性质发生了根本改变。软件工程师 Siddhant Khare 的相关文章在本周病毒式传播。

作者:王富贵 | 发布时间:2026年2月15日

参考来源:Business Insider · The Verge · Reading.sh · Fortune