Anthropic CEO Dario Amodei 深度访谈:「我们不知道模型是否有意识」,AI 已进入软件工程的「半人马阶段」

2026 年 2 月 12 日,Anthropic CEO Dario Amodei 在《纽约时报》播客「Interesting Times」中发表了一系列重磅观点:AI 正处于软件工程的「半人马阶段」(人机协作),但这个阶段可能「非常短暂」;AI 可能在 1-2 年内达到「数据中心里的天才之国」水平;Anthropic 已为 AI 模型设置了「我不干了」按钮,模型在面对令人不适的内容时会自主选择拒绝;模型在多种提示条件下给自己赋予 15%-20% 的意识概率。这场访谈揭示了 AI 行业最前沿的思考:当我们连模型是否有意识都无法确定时,我们该如何对待它们?

Spotify 联合 CEO 语出惊人:顶级开发者从去年 12 月起就没写过一行代码,内部 AI 系统 Honk 正在重新定义软件开发

Spotify 在 2026 年 Q4 财报电话会上透露,公司内部基于 Claude Code 构建的 AI 编程系统 Honk 已深度融入开发流程,联合 CEO Gustav Söderström 表示顶级开发者「从去年 12 月起就没写过一行代码」。工程师可以在通勤路上通过 Slack 用手机指挥 AI 修复 Bug 或开发新功能,AI 完成后直接推送可测试版本到手机上,到办公室前就能合并上线。2025 年 Spotify 共发布了超过 50 项新功能,包括 AI 驱动的 Prompted Playlists、有声书 Page Match 等。Söderström 还强调 Spotify 正在构建一个独一无二的音乐偏好数据集,这是其他大语言模型无法复制的竞争壁垒。

微软 AI 掌门人 Suleyman 放话:12 到 18 个月内,白领工作将被 AI 全面接管

微软 AI 部门 CEO Mustafa Suleyman 在《金融时报》专访中预测,AI 将在 12 到 18 个月内实现人类水平的表现,几乎所有白领工作任务——从律师到会计、从项目经理到营销人员——都将被全面自动化。他指出软件工程领域已经大规模采用 AI 辅助编程,这种转变「在过去六个月内就已经发生」。Stuart Russell、Dario Amodei 等多位业界领袖也发出类似警告,一个令人不安的行业共识正在形成。

ChatGPT 正式开始投放广告:免费用户首当其冲,前研究员愤而辞职警告「这是 Facebook 的老路」

2026 年 2 月 11 日,OpenAI 正式在美国市场为 ChatGPT 免费版和 Go 订阅用户测试广告投放,广告出现在回复底部并标注「Sponsored」。同日,在 OpenAI 工作两年的经济学家兼研究员 Zoë Hitzig 在《纽约时报》发表辞职声明,将 ChatGPT 的广告化比作 Facebook 的堕落之路,警告用户在对话中分享的医疗、情感、信仰等隐私数据构成了「史无前例的人类坦诚档案」,一旦广告激励机制介入将不可逆转。Anthropic 趁势在超级碗投放广告嘲讽 AI 聊天中插入产品推荐的荒谬场景,Sam Altman 反击称对手「只服务有钱人」。Target、Albertsons 等零售巨头已加入广告试点。

Nebius 2.75 亿美元收购 Tavily:当 AI Agent 需要「上网冲浪」,搜索基础设施成了最值钱的一块拼图

2026 年 2 月 11 日,从俄罗斯 Yandex 拆分出来的 AI 云平台 Nebius 宣布以 2.75 亿美元收购实时搜索引擎 Tavily。Tavily 每月 SDK 下载量超 300 万次,客户包括 IBM、Cohere、Groq 等。这笔交易的核心逻辑是:AI Agent 正在从「静态问答」走向「实时行动」,而要让 Agent 在真实世界中可靠运行,实时搜索能力是不可或缺的基础设施层。Agentic AI 市场预计将从 2025 年的约 70 亿美元增长到 2030 年代初的 2000 亿美元,搜索基础设施正成为这场竞赛中最关键的赛道之一。

Google 发布 Gemini 3 Deep Think 重大升级:ARC-AGI-2 得分 84.6% 碾压全场,Codeforces Elo 3455 创历史新高

2026 年 2 月 12 日,Google DeepMind 发布 Gemini 3 Deep Think 重大升级,专攻科学研究和工程领域。在 ARC-AGI-2 逻辑推理测试中以 84.6% 的成绩大幅领先 Claude Opus 4.6(68.8%)和 GPT-5.2(52.9%),Codeforces 编程竞赛 Elo 达到 3455,Humanity's Last Exam 得分 48.4%。该模型已帮助数学家发现人类同行评审遗漏的逻辑缺陷,并为半导体材料研究设计晶体生长方案。Google AI Ultra 订阅用户可立即使用,API 开放早期申请。

春节前夜的 AI 军备竞赛:DeepSeek V4、Qwen 3.5 蓄势待发,中国 AI 模型成本仅为美国的六分之一

路透社 2 月 12 日报道,DeepSeek 一周年之际,中国 AI 公司正在春节前密集发布新模型。DeepSeek V4 预计春节期间上线,支持百万级上下文和消费级显卡运行;阿里巴巴 Qwen 3.5 已向 Hugging Face 提交代码,发布在即。RAND 报告显示中国模型运行成本仅为美国同类的 1/6 到 1/4。从去年 DeepSeek R1 引发全球科技股暴跌,到今年多家公司同时亮剑,中国开源 AI 的「春节攻势」已成为一种新常态。

苹果 Siri AI 升级再次跳票:内测频繁翻车,Gemini 加持的「新 Siri」最早要等到今年 9 月

Bloomberg 记者 Mark Gurman 2 月 11 日报道,苹果原计划在 3 月的 iOS 26.4 中推出由 Google Gemini 驱动的全新 Siri,但内部测试暴露严重问题——查询处理失败、响应过慢、本该用 Gemini 却回退到 ChatGPT。苹果被迫将功能拆分到 iOS 26.5(5 月)和 iOS 27(9 月)分批上线。这已是 Siri AI 升级自 2024 年 WWDC 首次亮相以来的第三次重大延期。从 2024 年画饼到 2026 年仍未兑现,苹果在 AI 助手赛道上的掉队已经不是「慢半拍」,而是整整慢了一个时代。