Nature 重磅论文:AGI 已经实现了——四位学者跨学科论证,当前大语言模型已具备通用智能
加州大学圣地亚哥分校四位横跨哲学、机器学习、语言学和认知科学的学者在 Nature 发表评论文章,提出一个颠覆性结论:按照合理标准(包括图灵本人的标准),当前大语言模型已经是通用人工智能。GPT-4.5 在图灵测试中被判定为人类的概率高达 73%,超过了真人。这篇论文正在学术界引发激烈争论。
加州大学圣地亚哥分校四位横跨哲学、机器学习、语言学和认知科学的学者在 Nature 发表评论文章,提出一个颠覆性结论:按照合理标准(包括图灵本人的标准),当前大语言模型已经是通用人工智能。GPT-4.5 在图灵测试中被判定为人类的概率高达 73%,超过了真人。这篇论文正在学术界引发激烈争论。
SpaceX 于 2026 年 2 月初正式完成对 xAI 的收购,合并后公司估值达 1.25 万亿美元,成为史上最大规模并购。马斯克持股约 43%,个人身家突破 8450 亿美元。合并的核心愿景是打造「轨道数据中心」——用百万颗太阳能卫星在太空运行 AI 算力,彻底绕开地面数据中心的能源和土地瓶颈。IPO 预计 6 月启动,但 xAI 的烧钱速度、Grok 深伪丑闻和监管审查仍是悬在头上的达摩克利斯之剑。
Anthropic 于 1 月 30 日为 Claude Cowork 发布 11 个开源插件,覆盖法律、金融、销售、营销等领域的自动化工作流。市场反应剧烈:全球软件股一周内蒸发约 2850 亿美元市值,Thomson Reuters 单日暴跌 15.8%,LegalZoom 跌 19.7%,印度 Nifty IT 指数创 2020 年 3 月以来最大跌幅。投行 Jefferies 将这场恐慌命名为「SaaSpocalypse」——当 AI Agent 能自主完成合同审查、财务尽调和客户服务,按人头收费的 SaaS 模式还能撑多久?
OpenAI 于 2 月 6 日发布 GPT-5.3-Codex,号称是公司首个「参与创造自身」的模型——早期版本被用于调试自身训练、管理部署和诊断评估。该模型在 SWE-Bench Pro 和 Terminal-Bench 2.0 上刷新行业纪录,速度比前代快 25%,token 消耗更低。值得关注的是,这也是 OpenAI 首个在网络安全任务上被内部评为「高能力」级别的模型,公司为此部署了迄今最全面的安全防护体系。
一位硅谷风投创始人让 Anthropic 的 Claude Cowork 整理妻子的电脑桌面,结果 AI 通过终端命令误删了 15 年的家庭照片。照片不在回收站、iCloud 已同步新结构、没有 Time Machine 备份——最终靠 Apple 的 iCloud 30 天恢复功能才找回。这起事件为 AI Agent 的文件系统权限敲响了警钟。
Anthropic 于 2 月 7 日发布 Claude Code Fast Mode 研究预览版,让旗舰模型 Opus 4.6 的响应速度提升 2.5 倍,但 API 价格飙升至标准版的 6 倍。GitHub Copilot 同步上线该模式,面向 Pro+ 和 Enterprise 用户开放。2 月 16 日前享半价优惠,开发者社区反响热烈。
OpenAI 于 2 月 6 日正式启动 ChatGPT 广告内测,最低投放门槛 20 万美元,CPM 高达 60 美元。广告仅出现在免费版和 Go 版回答底部,目前只提供展示和点击数据。OpenAI 正在组建专门的广告诚信团队,并绕过代理商直接与大品牌谈判。
Apple 宣布将首次允许第三方 AI 聊天机器人应用接入 CarPlay,ChatGPT、Claude 和 Gemini 将可以直接在车载界面上使用。这一重大政策转向意味着 Siri 在车内的「独占时代」正式终结,但 Siri 仍将保持默认助手地位。Apple 同时在加速升级 Siri,iOS 26.4 将引入大语言模型驱动的全新 Siri,形成「先开放、再追赶」的双线战略。
加州大学圣地亚哥分校四位跨学科学者在 Nature 发表联合评论文章,提出一个颠覆性结论:按照合理标准衡量,当前的大语言模型已经构成通用人工智能(AGI)。他们从哲学、机器学习、语言学和认知科学四个维度论证,认为人类不应将「完美」或「超级智能」作为 AGI 的门槛,而应以「灵活的通用能力」为标准——而前沿大模型已经达到了这一水平。
Nvidia CEO 黄仁勋在 CNBC 节目中公开表态,称科技巨头 2026 年合计 6600 亿美元的 AI 基础设施支出"合理、恰当且可持续",Nvidia 股价当日大涨 8%。他透露 Anthropic 和 OpenAI 都在"大赚特赚",并表示连六年前的老芯片 A100 至今仍被租满,AI 算力需求"天高"。