Code Metal 三个月估值翻五倍至 12.5 亿美元:用形式化验证解决 AI 代码信任问题,美国空军和雷神已是客户,Salesforce 领投 1.25 亿美元 B 轮

📌 一句话总结:波士顿 AI 代码翻译初创公司 Code Metal 完成 1.25 亿美元 B 轮融资,估值从 2.5 亿美元飙升至 12.5 亿美元,Salesforce Ventures 领投,客户包括美国空军、RTX(原雷神)和东芝,用「神经符号 AI + 形式化验证」解决 AI 生成代码的信任问题。

2026年2月21日 · 资讯分享 · 阅读时间约 5 分钟

三个月估值翻五倍,Code Metal 凭什么?

当整个行业都在讨论 AI 写代码有多快的时候,一家波士顿初创公司在问一个更尖锐的问题:AI 写的代码,你敢用在战斗机上吗?

Code Metal 给出的答案是:敢,但前提是每一行代码都经过数学级别的验证。

2 月 19 日,Code Metal 宣布完成 1.25 亿美元 B 轮融资,由 Salesforce Ventures 领投,Accel、B Capital、Smith Point Capital、J2 Ventures、Shield Capital 以及国防巨头 RTX(原雷神公司)跟投。公司估值从去年 11 月的 2.5 亿美元直接跳到 12.5 亿美元——三个月翻了五倍,正式跻身独角兽行列。

更值得注意的是,这距离他们的 A 轮(3600 万美元)仅仅过去了三个月。

不是又一个 Copilot,而是代码的「翻译官 + 公证人」

Code Metal 做的事情和 GitHub Copilot 完全不同。它的核心能力是跨语言代码翻译——把 Python、Julia、Matlab、C++ 等高级语言的代码,翻译成 Rust、VHDL 以及 Nvidia CUDA 等底层语言或硬件专用语言。

翻译本身不稀奇,市面上能做代码翻译的 AI 工具一大把。Code Metal 的杀手锏在于形式化验证(Formal Verification):在翻译的每一步,系统都会生成测试套件,用数学方法穷举代码的所有可能状态,确保翻译后的代码与原始代码在功能上完全等价。

AI 可以以前所未有的速度生成代码,但在关键任务环境中,没有证明的速度是不够的——我们正在构建确保软件在部署前可被信任的基础设施。
— 来源:Code Metal CEO Peter Morales,SiliconANGLE

CEO Peter Morales 曾在微软和 MIT 林肯实验室工作,他表示 Code Metal 的可靠性测试符合 MC/DC 标准——这是航空飞控软件使用的验证标准。换句话说,如果翻译过程中出现无法验证的情况,系统会直接告诉你「这段代码无法完成翻译」,而不是悄悄塞给你一个带 bug 的版本。

客户名单说明一切

Code Metal 的早期客户阵容相当硬核:

客户 领域 应用场景
美国空军 国防 遗留系统代码现代化
RTX(原雷神) 国防/航空 关键任务代码翻译
L3Harris 国防电子 代码验证与迁移
东芝 工业电子 跨平台代码移植
博世 汽车/工业 嵌入式系统代码翻译

此外,Code Metal 还在与一家大型芯片公司洽谈跨芯片平台的代码可移植性合作(具体名称未披露)。

Karpathy 一条推文,说透了这个赛道

Code Metal 的 CEO 在接受 WIRED 采访时,直接引用了 Andrej Karpathy 最近的一条推文:

C 到 Rust 的移植势头越来越猛……我们很可能会把人类写过的大部分软件重写很多遍。
— 来源:Andrej Karpathy via WIRED

Morales 说:「他那条推文,就是我们在做的全部事情。」

这不是夸张。全球有数十亿行遗留代码运行在关键基础设施上——从卫星通信到电网控制,从飞行控制到工业机器人。这些代码大多用 C、Fortran、Ada 等老语言写成,维护它们的工程师正在退休,而新一代开发者对这些语言越来越陌生。

B Capital 合伙人 Yan-David Erlich 说得更直白:「控制通信基础设施甚至卫星的代码,很多都是老旧的、用人们不再使用的语言写的。它需要现代化。但在翻译过程中,你可能会引入 bug——这在关键系统中是灾难性的。」

AI 代码信任赛道正在成型

Code Metal 并不孤独。过去两年,一批围绕「AI 代码可信度」的初创公司密集获得融资:

  • Antithesis — AI 代码自动化测试
  • Code Rabbit — AI 代码审查
  • Synthesized — 测试数据生成
  • Theorem — 代码验证
  • Harness — AI 代码安全

WIRED 将这些公司称为 AI 淘金热中的「卖铲子的人」——它们不直接生成代码,而是确保 AI 生成的代码值得信赖。当 AI 编码工具的产出量越来越大,验证和信任层的价值只会越来越高。

富贵点评

Code Metal 的故事揭示了 AI 编码赛道一个被严重低估的分支:不是谁写代码写得快,而是谁能证明代码是对的。当 Copilot 们在比拼生成速度的时候,Code Metal 在卖「数学级别的信任」——而且卖给的是最不能出错的客户:军方和航空航天。

三个月从 A 轮到 B 轮、估值翻五倍,这个速度本身就说明市场对「可验证 AI 代码」的需求有多饥渴。Karpathy 说得对,人类写过的软件迟早要被重写很多遍——但重写的前提是,新代码必须比旧代码更可靠,而不是更快但更危险。Code Metal 押对了这个逻辑。

📋 要点回顾

  • 融资规模:1.25 亿美元 B 轮,Salesforce Ventures 领投,估值 12.5 亿美元(三个月前仅 2.5 亿)
  • 核心技术:AI 跨语言代码翻译 + 形式化验证,每一步翻译都生成数学证明确保正确性
  • 客户阵容:美国空军、RTX、L3Harris、东芝、博世等国防和工业巨头
  • 行业背景:全球数十亿行遗留代码亟需现代化,AI 代码信任赛道正在快速成型
  • 竞争格局:与 Copilot 类工具不同,Code Metal 专注「代码翻译 + 验证」的垂直场景,瞄准关键任务市场

❓ 常见问题

Q: Code Metal 和 GitHub Copilot 有什么区别?

A: Copilot 是「AI 帮你写新代码」,Code Metal 是「AI 帮你把已有代码从一种语言翻译成另一种语言,并用数学方法证明翻译是正确的」。两者解决的是完全不同的问题,Code Metal 更偏向关键任务场景。

Q: 形式化验证是什么?为什么重要?

A: 形式化验证是用数学方法穷举程序所有可能的运行状态,证明代码不存在特定类型的错误。传统测试只能覆盖有限场景,形式化验证理论上可以覆盖所有场景。在航空飞控、军事系统等不允许出错的领域,这是刚需。

Q: 为什么遗留代码翻译是一个大市场?

A: 全球关键基础设施中运行着数十亿行用 C、Fortran、Ada 等老语言写的代码,维护这些代码的工程师正在退休,新开发者不熟悉这些语言。同时,Rust 等内存安全语言的兴起让代码迁移变得更加迫切——美国政府已经明确建议关键系统迁移到内存安全语言。

作者:王富贵 | 发布时间:2026年2月21日

参考来源:WIRED · SiliconANGLE · TechFundingNews