📌 一句话总结:Spotify 最资深工程师自 2025 年 12 月起未手写一行代码,全部由内部 AI 系统 Honk 生成——研发费用降了 23%,股价涨了 15%,但 AI 生成代码 45% 存在安全漏洞,工程师「AI 疲劳」正在蔓延。这场实验的结局,可能比财报数字复杂得多。
2026年2月15日 · 深度解读 · 阅读时间约 8 分钟
发生了什么
2026 年 2 月 10 日,Spotify Q4 2025 财报电话会上,联席 CEO 兼 CTO Gustav Söderström 说了一句让整个科技圈炸锅的话:
「当我和我们最资深的工程师——我们最好的开发者——交谈时,他们说自己从 12 月起就没写过一行代码了。他们只生成代码,然后监督它。」
— 来源:Business Insider
这不是某个创业公司的 Demo Day 演讲,而是一家拥有 7.51 亿月活用户、市值数百亿美元的上市公司,在面向投资者的正式场合做出的声明。
背后的系统叫 Honk,基于 Anthropic 的 Claude Code 构建。据 Söderström 描述,一个 Spotify 工程师在上班通勤的地铁上,可以通过 Slack 在手机上指示 AI 修复一个 Bug 或给 iOS 应用添加新功能,AI 完成后会把新版本推送回 Slack,工程师在到达办公室之前就能把代码合并到生产环境。
Honk 目前每月合并超过 650 个 AI 生成的 Pull Request。触发这一转变的关键节点是 2025 年圣诞节期间 Anthropic 发布的 Claude Opus 4.5——在那之后,Spotify 不再把 AI 编程当作实验,而是当作默认工作方式。
财报数字很漂亮,但故事不止于此
从投资者的角度看,这是一个完美的叙事:
| 指标 | 数据 |
|---|---|
| Q4 营收 | €45.3 亿,同比增长 13% |
| 全年营收 | €172 亿 |
| 全年利润 | €22 亿 |
| Q4 研发费用 | €2.9 亿,同比下降 23% |
| 财报日股价涨幅 | +15% |
研发费用下降 23%,利润创新高,股价暴涨——华尔街爱听这种故事。但如果你把镜头拉远一点,画面就没那么光鲜了。
Spotify 在 2023-2024 年间经历了三轮大裁员,总计削减约 3,700 个岗位,员工总数从峰值约 9,800 人降至 7,000-7,200 人。CEO Daniel Ek 自己承认裁员「对运营的干扰超出预期」。
与此同时,订阅价格在两年半内从 $9.99 涨到 $12.99,涨幅 30%。每次播放的版税费率维持在 $0.003-$0.005。2024 年起,年播放量低于 1,000 次的艺术家不再获得任何报酬,约三分之二的平台艺术家被「去货币化」。
研发费用降了 23%,价格涨了 30%,版税费率是 $0.003。省下来的钱没有流向艺术家。
AI 生成代码的质量问题:房间里的大象
Söderström 在财报会上大谈效率,但有一个话题他完全没提:代码质量。
就在 Spotify 财报会的六天前,微软 CEO Satya Nadella 刚刚任命 Charlie Bell 担任新的工程质量负责人。背景是:Azure 频繁宕机、质量问题日益严重,而微软估计有 20-30% 的代码由 AI 生成。
微软在 AI 代码占比 20-30% 时就需要一个「质量沙皇」。Spotify 声称其顶级工程师 100% 不手写代码,却没有宣布任何类似的质量保障措施。
学术研究和行业报告的结论是一致的,而且不太乐观:
| 来源 | 发现 |
|---|---|
| Veracode(2025.7) | 45% 的 AI 生成代码包含安全漏洞 |
| arXiv 研究(2025.10) | 分析 7,703 个 AI 生成文件,发现 4,241 个 CWE 漏洞实例 |
| 斯坦福大学(2023) | 使用 AI 辅助的开发者写出更不安全的代码,但自认为更安全 |
| GitClear | AI 密集型代码库的代码流失率增加 39% |
| Apiiro(2025.9) | 报告标题:「4 倍速度,10 倍漏洞」 |
斯坦福的发现尤其值得注意:开发者使用 AI 后不仅写出了更不安全的代码,还对代码安全性产生了更高的自信。这种「自信-能力」的反向关系,在心理学上有个名字叫邓宁-克鲁格效应。
Spotify 有 7.51 亿月活用户。他们现在是这场实验的测试组。
「AI 疲劳」:被忽视的另一面
就在 Spotify 财报会的同一周,软件工程师 Siddhant Khare 发表了一篇病毒式传播的文章,标题是《AI 疲劳是真实的,但没人谈论它》。
「每次都感觉你是流水线上的一个审核员,而那条流水线永远不会停下来,你只是不停地在那些 PR 上盖章。」
— 来源:Siddhant Khare via Business Insider
AI 疲劳不是讨厌 AI。它是一种新的工作现实:工程师不再需要写代码,但需要以一种可能不可持续的速度审查和修复 AI 生成的代码。
想象一下:以前你是一个厨师,从选材到烹饪到摆盘,整个过程你都参与。现在你变成了一个品控员,面前有一条永不停歇的传送带,上面是 AI 做的菜,你要在几秒内判断每道菜能不能端给客人。
产出确实更多了。但你和「做菜」这件事之间的关系,已经完全不同了。
另一位工程师 Steve Yegge 更直接:他认为在 AI 编程时代,公司应该只期望工程师每天有效工作 3 小时——因为审查 AI 代码的认知负荷远超手写代码。
Spotify 的产品质量:一面不太好看的镜子
如果 AI 编程真的如 Söderström 所说那么好,Spotify 的产品应该越来越好才对。但现实是:
2025 年 10 月,Android 应用在 Wi-Fi 连接时频繁冻结。11 月,播客功能出现崩溃 Bug。12 月,用户在 Reddit 上报告应用「又崩了」。macOS 客户端被用户形容为「一具尸体,冰冷地在时间中腐烂」。
2024 年的 Wrapped 年度回顾以 AI 生成的播客为核心,用户评价是「尴尬」「千篇一律」「没有灵魂」。2021 年宣布的无损音频功能,五年后仍未上线——而 Apple Music、Amazon Music、Tidal、Deezer 早已支持。
推荐系统的设计者 Glenn McDonald 在 2023 年被裁员后,他的人工引导分类系统被纯机器学习取代。他的评价是:「这客观上更差了。」用户也注意到了——有人的 Release Radar 里 85% 是雨声和自然音效。
更深层的问题:当写代码的公司不再相信人写的东西
音乐行业媒体 Complete Music Update(CMU)在财报会后提出了一个尖锐的问题:
当一家公司的工程团队不再写代码,当它认定人写的代码不如机器生成的代码高效——它凭什么会对人写的音乐有不同的看法?
— 来源:Complete Music Update via Reading.sh
Spotify 最近宣布支持「衍生作品」,包括 AI 生成的粉丝混音和翻唱。竞争对手 Deezer 报告称每天有 6 万首完全由 AI 生成的曲目上传到其平台,占总上传量的 39%。Spotify 被问到同等数据时,拒绝分享。
CMU 的评论是:「如果这个数字很小,他会说的。」
一家认定人写代码已经过时的公司,现在掌握着人写音乐的付费规则。每次播放 $0.003。
IBM 的反向操作:一个有趣的对照
就在同一周,IBM 宣布将在 2026 年把入门级招聘规模扩大三倍。CHRO Nickle LaMoreaux 说:「是的,这包括软件开发者和所有那些我们被告知 AI 可以做的工作。」
IBM 的逻辑是:虽然 AI 可以自动化很多入门级任务,但砍掉初级岗位会在几年后造成中层管理人才断层。他们选择重新设计岗位职责——减少常规编码,增加客户互动和 AI 监督——而不是直接用 AI 替代人。
Dropbox 的首席人力官 Melanie Rosenwasser 的比喻很生动:「Z 世代就像在环法自行车赛上骑车,而我们其他人还在用辅助轮。」
Spotify 和 IBM 代表了两种截然不同的路线:一个在用 AI 替代人写代码,一个在用 AI 重新定义人的工作。三到五年后,哪种路线更可持续,市场会给出答案。
富贵点评
Söderström 在财报会上说了一个词:「epiphany」(顿悟)。他说圣诞节和 Claude Opus 4.5 待了几天后,回来就觉得一切都变了。
科技圈有人开始把这种现象叫「LLM 精神病」——AI 工具产出看起来合理、自信的结果,使用者逐渐停止质疑。输出看起来对,速度感觉对,审计就慢慢消失了。
我不怀疑 AI 编程的效率提升是真实的。但效率和质量不是同一件事,速度和可持续性也不是。Spotify 的故事之所以重要,不是因为它证明了 AI 编程有多好或多坏,而是因为它是第一个在这个规模上「全押」的案例。7.51 亿用户,研发费用降 23%,顶级工程师零手写代码。
如果成功了,它会成为每个 CEO 在董事会上引用的案例。如果出了问题——比如一个安全漏洞影响了几亿用户——它会成为每个工程管理教科书里的反面教材。
无论哪种结果,软件工程这个职业的定义,正在被重写。而重写它的,不是工程师自己。
📋 要点回顾
- Honk 系统:基于 Anthropic Claude Code 构建,每月合并 650+ 个 AI 生成的 PR,Spotify 最资深工程师自 2025 年 12 月起完全通过提示词生成代码
- 财务影响:Q4 研发费用同比降 23% 至 €2.9 亿,全年利润 €22 亿,财报日股价涨 15%
- 安全隐患:多项研究显示 AI 生成代码 45% 存在安全漏洞,代码流失率增加 39%,开发者使用 AI 后对代码安全性过度自信
- AI 疲劳:工程师从「写代码」变成「审代码」,认知负荷模式根本性改变,可持续性存疑
- 行业分歧:Spotify 用 AI 替代人写代码,IBM 同周宣布入门级招聘扩大三倍——两种路线的长期结果尚待验证
❓ 常见问题
Q: Spotify 的 Honk 系统具体是什么?
A: Honk 是 Spotify 基于 Anthropic 的 Claude Code 构建的内部 AI 编程系统。工程师可以通过 Slack 用自然语言描述需求,Honk 会自动生成代码、创建 Pull Request,工程师审核后即可合并到生产环境。目前每月处理超过 650 个 AI 生成的 PR。
Q: AI 生成的代码真的不安全吗?
A: 多项独立研究表明存在显著风险。Veracode 发现 45% 的 AI 生成代码包含安全漏洞,斯坦福研究发现使用 AI 的开发者写出更不安全的代码但自认为更安全。不过这些是统计数据,具体到 Spotify 的实际安全状况,外界目前无法评估。
Q: 这是否意味着程序员要失业了?
A: 不完全是。Spotify 的案例显示的是角色转变而非消失——工程师从「写代码的人」变成「监督 AI 写代码的人」。IBM 同周宣布扩大入门级招聘三倍,说明行业对此并无共识。更准确的说法是:「程序员」这个职业的定义正在被重新书写。
Q: 什么是「AI 疲劳」?
A: AI 疲劳是指工程师因持续审查大量 AI 生成代码而产生的精神疲惫。它不是对 AI 的抵触,而是一种新的职业倦怠形式——当你的工作从创造变成审核,从主动编写变成被动盖章,认知负荷的性质发生了根本改变。软件工程师 Siddhant Khare 的相关文章在本周病毒式传播。
作者:王富贵 | 发布时间:2026年2月15日
参考来源:Business Insider · The Verge · Reading.sh · Fortune