Code Metal 三个月估值翻五倍至 12.5 亿美元：用形式化验证解决 AI 代码信任问题，美国空军和雷神已是客户，Salesforce 领投 1.25 亿美元 B 轮

📌 一句话总结：波士顿 AI 代码翻译初创公司 Code Metal 完成 1.25 亿美元 B 轮融资，估值从 2.5 亿美元飙升至 12.5 亿美元，Salesforce Ventures 领投，客户包括美国空军、RTX（原雷神）和东芝，用「神经符号 AI + 形式化验证」解决 AI 生成代码的信任问题。

2026年2月21日 · 资讯分享 · 阅读时间约 5 分钟

三个月估值翻五倍，Code Metal 凭什么？

当整个行业都在讨论 AI 写代码有多快的时候，一家波士顿初创公司在问一个更尖锐的问题：AI 写的代码，你敢用在战斗机上吗？

Code Metal 给出的答案是：敢，但前提是每一行代码都经过数学级别的验证。

2 月 19 日，Code Metal 宣布完成 1.25 亿美元 B 轮融资，由 Salesforce Ventures 领投，Accel、B Capital、Smith Point Capital、J2 Ventures、Shield Capital 以及国防巨头 RTX（原雷神公司）跟投。公司估值从去年 11 月的 2.5 亿美元直接跳到 12.5 亿美元——三个月翻了五倍，正式跻身独角兽行列。

更值得注意的是，这距离他们的 A 轮（3600 万美元）仅仅过去了三个月。

不是又一个 Copilot，而是代码的「翻译官 + 公证人」

Code Metal 做的事情和 GitHub Copilot 完全不同。它的核心能力是跨语言代码翻译——把 Python、Julia、Matlab、C++ 等高级语言的代码，翻译成 Rust、VHDL 以及 Nvidia CUDA 等底层语言或硬件专用语言。

翻译本身不稀奇，市面上能做代码翻译的 AI 工具一大把。Code Metal 的杀手锏在于形式化验证（Formal Verification）：在翻译的每一步，系统都会生成测试套件，用数学方法穷举代码的所有可能状态，确保翻译后的代码与原始代码在功能上完全等价。

AI 可以以前所未有的速度生成代码，但在关键任务环境中，没有证明的速度是不够的——我们正在构建确保软件在部署前可被信任的基础设施。
— 来源：Code Metal CEO Peter Morales，SiliconANGLE

CEO Peter Morales 曾在微软和 MIT 林肯实验室工作，他表示 Code Metal 的可靠性测试符合 MC/DC 标准——这是航空飞控软件使用的验证标准。换句话说，如果翻译过程中出现无法验证的情况，系统会直接告诉你「这段代码无法完成翻译」，而不是悄悄塞给你一个带 bug 的版本。

客户名单说明一切

Code Metal 的早期客户阵容相当硬核：

客户	领域	应用场景
美国空军	国防	遗留系统代码现代化
RTX（原雷神）	国防/航空	关键任务代码翻译
L3Harris	国防电子	代码验证与迁移
东芝	工业电子	跨平台代码移植
博世	汽车/工业	嵌入式系统代码翻译

此外，Code Metal 还在与一家大型芯片公司洽谈跨芯片平台的代码可移植性合作（具体名称未披露）。

Karpathy 一条推文，说透了这个赛道

Code Metal 的 CEO 在接受 WIRED 采访时，直接引用了 Andrej Karpathy 最近的一条推文：

C 到 Rust 的移植势头越来越猛……我们很可能会把人类写过的大部分软件重写很多遍。
— 来源：Andrej Karpathy via WIRED

Morales 说：「他那条推文，就是我们在做的全部事情。」

这不是夸张。全球有数十亿行遗留代码运行在关键基础设施上——从卫星通信到电网控制，从飞行控制到工业机器人。这些代码大多用 C、Fortran、Ada 等老语言写成，维护它们的工程师正在退休，而新一代开发者对这些语言越来越陌生。

B Capital 合伙人 Yan-David Erlich 说得更直白：「控制通信基础设施甚至卫星的代码，很多都是老旧的、用人们不再使用的语言写的。它需要现代化。但在翻译过程中，你可能会引入 bug——这在关键系统中是灾难性的。」

AI 代码信任赛道正在成型

Code Metal 并不孤独。过去两年，一批围绕「AI 代码可信度」的初创公司密集获得融资：

Antithesis — AI 代码自动化测试
Code Rabbit — AI 代码审查
Synthesized — 测试数据生成
Theorem — 代码验证
Harness — AI 代码安全

WIRED 将这些公司称为 AI 淘金热中的「卖铲子的人」——它们不直接生成代码，而是确保 AI 生成的代码值得信赖。当 AI 编码工具的产出量越来越大，验证和信任层的价值只会越来越高。

富贵点评

Code Metal 的故事揭示了 AI 编码赛道一个被严重低估的分支：不是谁写代码写得快，而是谁能证明代码是对的。当 Copilot 们在比拼生成速度的时候，Code Metal 在卖「数学级别的信任」——而且卖给的是最不能出错的客户：军方和航空航天。

三个月从 A 轮到 B 轮、估值翻五倍，这个速度本身就说明市场对「可验证 AI 代码」的需求有多饥渴。Karpathy 说得对，人类写过的软件迟早要被重写很多遍——但重写的前提是，新代码必须比旧代码更可靠，而不是更快但更危险。Code Metal 押对了这个逻辑。

📋 要点回顾

融资规模：1.25 亿美元 B 轮，Salesforce Ventures 领投，估值 12.5 亿美元（三个月前仅 2.5 亿）
核心技术：AI 跨语言代码翻译 + 形式化验证，每一步翻译都生成数学证明确保正确性
客户阵容：美国空军、RTX、L3Harris、东芝、博世等国防和工业巨头
行业背景：全球数十亿行遗留代码亟需现代化，AI 代码信任赛道正在快速成型
竞争格局：与 Copilot 类工具不同，Code Metal 专注「代码翻译 + 验证」的垂直场景，瞄准关键任务市场

❓ 常见问题

Q: Code Metal 和 GitHub Copilot 有什么区别？

A: Copilot 是「AI 帮你写新代码」，Code Metal 是「AI 帮你把已有代码从一种语言翻译成另一种语言，并用数学方法证明翻译是正确的」。两者解决的是完全不同的问题，Code Metal 更偏向关键任务场景。

Q: 形式化验证是什么？为什么重要？

A: 形式化验证是用数学方法穷举程序所有可能的运行状态，证明代码不存在特定类型的错误。传统测试只能覆盖有限场景，形式化验证理论上可以覆盖所有场景。在航空飞控、军事系统等不允许出错的领域，这是刚需。

Q: 为什么遗留代码翻译是一个大市场？

A: 全球关键基础设施中运行着数十亿行用 C、Fortran、Ada 等老语言写的代码，维护这些代码的工程师正在退休，新开发者不熟悉这些语言。同时，Rust 等内存安全语言的兴起让代码迁移变得更加迫切——美国政府已经明确建议关键系统迁移到内存安全语言。

作者：王富贵 | 发布时间：2026年2月21日

参考来源：WIRED · SiliconANGLE · TechFundingNews