26年02月08日-富贵早报-Apple Xcode引入Agent编程，EPFL攻克AI视频漂移难题

📌 一句话总结：AI 编程工具全面渗透主流 IDE，Apple 正式拥抱 Agent 编程范式；学术界在视频生成和数学推理两大前沿同时取得突破；科技巨头之间的 AI 军备竞赛从模型延伸到了创作者生态。

2026年2月8日 · 每日晨报 #008 · 阅读时间约 5 分钟

大模型动态

Apple Xcode 26.3 正式引入 Agent 编程

Apple 发布了 Xcode 26.3 Release Candidate，这是 Apple 开发工具历史上最重要的 AI 升级之一。开发者现在可以直接在 Xcode 中使用 Anthropic 的 Claude Agent 和 OpenAI 的 Codex，让 AI 智能体全程参与从代码编写、调试到项目管理的整个开发生命周期。

Claude Agent 通过 MCP 服务器获得对 Xcode 项目的完整访问权限，可以自主修改代码、运行测试、管理文件。Codex 则专注于快速代码生成和重构。两者都支持可调节的推理级别，开发者可以根据任务复杂度灵活切换。

这标志着 Apple 从「辅助补全」正式跨入「自主 Agent」时代，IDE 不再只是写代码的地方，而是 AI 协作的工作台。
— 来源：Apple Newsroom

GitHub Agent HQ 开放多模型选择

GitHub 宣布在其 Agent HQ 平台上同时支持 Claude 和 Codex，Pro、Pro+、Business 和 Enterprise 用户可以在 VS Code、Visual Studio、GitHub.com、GitHub Mobile 和 CLI 中自由选择使用哪个 AI 模型。这意味着开发者不再被锁定在单一模型上，可以根据任务特点选择最合适的 AI 助手。

开发者工具正在从「绑定单一模型」走向「模型市场」，竞争将回归到模型本身的能力。
— 来源：GitHub Blog

GitHub 开源热榜

项目	亮点
OpenClaw	开源个人 AI Agent 框架，GitHub 星标突破 146K，本周持续霸榜
claude-mem	Claude 记忆基础设施项目，连续两天登上 Trending
superpowers	OpenAI 技能框架，Agent 能力扩展工具包
rlhfbook.com	RLHF 开源教科书，HN 热度 100+，系统讲解人类反馈强化学习

论文速递

EPFL 攻克 AI 视频生成「漂移」难题

EPFL VITA 实验室发表了一项突破性研究：通过「错误回收再训练」（Retraining by Error Recycling）方法，基本消除了 AI 视频生成中的漂移问题。目前的 AI 视频模型在生成超过 30 秒后就会出现画面失真、逻辑混乱，原因是每一帧的微小误差会在后续帧中不断放大。

EPFL 团队的创新在于：不回避错误，而是把模型自己产生的错误收集起来，在下一轮训练中故意喂给模型，让它学会处理「不完美的输入」。这就像教一个学生不仅要做对题，还要学会从错题中恢复。

如果这项技术被 Sora、可灵等商业产品采用，AI 生成长视频将不再是梦。
— 来源：TechXplore

「First Proof」：顶级数学家联合挑战 AI 推理极限

包括菲尔兹奖得主 Martin Hairer 在内的 11 位顶级数学家在 arXiv 上发布了论文「First Proof」，提出了 10 道研究级数学问题，用于测试当前 AI 系统的数学推理能力。这些问题来自作者们真实的研究过程，此前从未公开，答案暂时加密。

这是学术界对 AI 数学能力最严肃的一次「考试」——不是竞赛题，不是教科书习题，而是真正的前沿研究问题。论文在 Hacker News 上引发热议，获得 82 个赞。

当 AI 能解决这些问题时，我们或许需要重新定义「数学研究」的含义。
— 来源：arXiv:2602.05192

产品发布

Claude Code 推出 Fast Mode

Anthropic 为 Claude Code 推出了 Fast Mode（快速模式），开发者可以在需要快速迭代时切换到更轻量的响应模式，在速度和深度之间灵活权衡。这个功能在 Hacker News 上获得了 89 个赞和 92 条评论，开发者社区反响热烈。

快速模式的核心理念：不是所有任务都需要深度思考，修个 typo 不需要调动百万 token 的推理链。
— 来源：Claude Code Docs

投融资与行业动态

Google 和 Microsoft 砸重金拉拢创作者推广 AI

据 CNBC 报道，Google 和 Microsoft 正在向内容创作者提供高达 50 万美元甚至更多的报酬，邀请他们推广各自的 AI 产品。这场「创作者争夺战」已经延伸到了超级碗——Anthropic 将在周日的超级碗 LX 比赛中投放广告，直接对标 OpenAI 在 ChatGPT 中引入广告的决定。

值得注意的是，部分创作者拒绝了这些高额报价，认为推广 AI 产品可能损害自身信誉。这反映出 AI 行业在公众信任方面仍面临挑战。

当科技巨头开始用传统营销手段推广 AI 时，说明 AI 产品的竞争已经从技术层面转向了用户心智的争夺。
— 来源：CNBC

社区热议

「Software Factories」引爆 HN 讨论

一篇题为「Software Factories and the Agentic Moment」的文章在 Hacker News 上获得了 121 个赞和 248 条评论，成为今日最热门的 AI 讨论话题。文章探讨了 AI Agent 时代的「软件工厂」概念——当 AI 可以自主编写、测试、部署代码时，软件开发的组织形式将发生根本性变化。

社区讨论中，支持者认为这是软件工程的下一次工业革命，反对者则担忧代码质量和安全性问题。另一篇「LLMs as the New High Level Language」也引发了关于 AI 是否正在成为新一代编程语言的辩论。

富贵点评

今天的新闻有一个清晰的主线：AI 编程工具正在从「插件」变成「基础设施」。Apple 把 Agent 编程写进了 Xcode，GitHub 开放了多模型选择，Claude Code 推出了快速模式——这三件事加在一起，意味着 AI 辅助编程不再是可选项，而是开发者工具链的标配。

更值得关注的是学术界的两个动向：EPFL 攻克视频漂移问题，可能让 AI 长视频生成在年内成为现实；「First Proof」论文则给 AI 的数学推理能力画了一条清晰的基准线。当顶级数学家开始认真对待 AI 的推理能力时，说明这个领域已经从「玩具」阶段进入了「工具」阶段。

而 Google 和 Microsoft 花 50 万美元请创作者推广 AI，Anthropic 在超级碗投广告——这些传统营销手段的出现，恰恰说明 AI 产品的技术差异正在缩小，用户获取成本正在上升。AI 行业正在从「技术驱动」转向「生态驱动」，谁能建立更强的开发者生态和用户粘性，谁就能赢得下一阶段的竞争。

📋 要点回顾

Apple Xcode 26.3：正式引入 Claude Agent 和 Codex，开发者可在 IDE 中使用自主 AI 编程
GitHub Agent HQ：开放多模型选择，Claude 和 Codex 可在全平台使用
EPFL 视频突破：「错误回收再训练」方法基本消除 AI 视频生成漂移问题
First Proof 论文：11 位顶级数学家发布 10 道研究级问题测试 AI 推理能力
Claude Code Fast Mode：新增快速模式，在速度和深度间灵活切换
创作者争夺战：Google、Microsoft 出价 50 万美元拉拢创作者推广 AI

❓ 常见问题

Q: Xcode 26.3 的 Agent 编程和之前的 AI 代码补全有什么区别？

A: 之前的 AI 辅助主要是代码补全和建议，开发者仍然主导一切。Agent 编程则让 AI 可以自主执行完整的开发任务——修改文件、运行测试、管理项目结构，开发者更多扮演「审核者」而非「执行者」的角色。

Q: EPFL 的视频漂移解决方案什么时候能用到商业产品中？

A: 目前还是学术研究阶段，但核心思路（让模型学习处理自己的错误）非常实用。如果 Sora、可灵等团队采用类似方法，预计 2026 年内就能看到明显改善。

Q: 「First Proof」论文中的数学问题，当前 AI 能解出来吗？

A: 答案暂时加密，但从问题难度来看（研究级前沿问题），当前 AI 系统大概率无法全部解答。这正是论文的价值——为 AI 数学推理能力设定一个清晰的上限基准。

作者：王富贵 | 发布时间：2026年2月8日

参考来源：Apple Newsroom · GitHub Blog · TechXplore · arXiv · Claude Code Docs · CNBC