Anthropic 发布 Claude Code Security:AI 安全扫描从实验室走进生产线,Opus 4.6 已在开源项目中挖出 500+ 个隐藏数十年的漏洞

Anthropic 推出 Claude Code Security 研究预览版,将 AI 驱动的代码安全扫描能力内置于 Claude Code。与传统规则匹配的 SAST 工具不同,它让 AI 像人类安全研究员一样理解代码上下文、追踪数据流,发现复杂的业务逻辑漏洞。使用 Opus 4.6,Anthropic 已在生产级开源代码库中发现超过 500 个隐藏多年的漏洞。Enterprise/Team 客户可申请使用,开源维护者享有免费加速通道。

llama.cpp 创始人正式加入 Hugging Face:本地 AI 推理的「事实标准」与「模型定义标准」合流,开源超级智能的基础设施就位了

llama.cpp 创始人 Georgi Gerganov 宣布 ggml.ai 团队正式加入 Hugging Face。项目保持 100% 开源和社区自治,双方将重点推进 llama.cpp 与 transformers 库的一键集成,以及改善本地模型的用户体验。这标志着本地 AI 推理从「个人英雄主义」走向「机构化运营」,开源 AI 基础设施的两大支柱正式合流。

OpenAI 砸 560 万英镑加入英国 AI 对齐联盟:微软、Anthropic、AWS 等巨头联手,60 个项目横跨 8 国,2700 万英镑打造全球最大 AI 安全研究网络

英国 AI 安全研究所(AISI)旗舰项目「Alignment Project」迎来重大扩容:OpenAI 注资 560 万英镑,微软同步加入,总资金池升至 2700 万英镑(约 3630 万美元)。首批 60 个研究项目覆盖 8 个国家,联盟成员涵盖 Anthropic、AWS、加拿大 CIFAR、澳大利亚 AI 安全研究所等。这是目前全球规模最大的 AI 对齐研究协作网络,标志着 AI 安全从「各自为战」正式进入「多边联盟」时代。

字节跳动 Seedance 2.0 震动好莱坞:AI 视频生成逼真到迪士尼和派拉蒙发律师函,中国 AI 视频赛道进入深水区

字节跳动发布 AI 视频生成模型 Seedance 2.0,凭借极高的画面真实度和易用性迅速走红,用户生成的名人恶搞视频席卷社交媒体。迪士尼、派拉蒙、美国电影协会和 SAG-AFTRA 工会接连发出停止侵权函。字节跳动紧急回应将加强版权保护,同时中国网信办正在加大对 AI 生成内容的标注监管力度。这场风波折射出中美 AI 竞赛、版权保护与技术监管之间的深层矛盾。

印度正式加入美国主导的「Pax Silica」联盟:十国联手构建 AI 与半导体替代供应链,全球技术秩序进入阵营化时代

印度于2月20日在新德里AI影响力峰会上正式签署Pax Silica宣言,成为第十个加入该美国主导联盟的国家。联盟覆盖稀土开采、芯片制造、算力基础设施和AI部署四大支柱,旨在构建排除中国的「可信技术生态」,标志着全球AI与半导体供应链正式进入阵营化时代。

Stripe 内部 AI 编码代理「Minions」曝光:每周自动合并 1300+ PR,人类工程师只负责审核

支付巨头 Stripe 公开其内部 AI 编码代理系统 Minions 的技术架构。这些全自动代理基于 Block 开源的 Goose 框架深度定制,运行在隔离的 Devbox 沙箱中,每周独立完成并合并超过 1300 个 Pull Request。系统通过 Blueprints 蓝图机制混合确定性步骤与 AI 自主决策,所有代码仍需人类工程师审核。这标志着 AI 编码正从辅助补全快速演进到独立交付阶段。

Perplexity 宣布放弃广告模式:6000 万月活不够撑起广告生意,转型订阅 + 企业 + 设备合作三条腿走路

AI 搜索公司 Perplexity 正式宣布放弃在产品中投放广告的计划,转而全力押注订阅付费、企业销售和设备预装合作。公司坦言「Perplexity 不适合所有人」,6000 万月活不到 ChatGPT 和 Gemini 的十分之一,广告模式难以为继。这一转向折射出 AI 搜索赛道的残酷现实:没有 Google 级别的用户规模,广告就是死路一条。

Google 发布 Gemini 3.1 Pro:ARC-AGI-2 推理得分 77.1% 翻倍碾压前代,但 Arena 排行榜仍不敌 Opus 4.6

Google 正式发布 Gemini 3.1 Pro,在 ARC-AGI-2 抽象逻辑基准上得分 77.1%,较前代 Gemini 3 Pro 的 31.1% 翻倍有余,同时超越 Anthropic Opus 4.6(68.8%)和 OpenAI GPT-5.2(52.9%)。Humanity's Last Exam 创下 44.4% 新纪录,SWE-Bench 编码测试 80.6% 几乎追平 Opus 4.6。但在 Arena 用户投票排行榜上,Opus 4.6 仍以 4 分优势领先。定价与前代持平,输入仅 /百万 token,约为 Opus 的七分之一。模型以预览版形式在 AI Studio、Vertex AI、Gemini App 等全平台同步上线。