OpenAI 向美国国会告状:DeepSeek 用「蒸馏」偷走了我们的模型能力,还用混淆路由器绕过封锁

📌 一句话总结:OpenAI 正式向美国国会提交备忘录,指控 DeepSeek 通过蒸馏技术和混淆路由器系统性窃取美国 AI 模型能力,将中美 AI 竞争从技术层面推向了政治博弈的新阶段。

2026年2月14日 · 资讯分享 · 阅读时间约 5 分钟

事件始末

2 月 12 日,OpenAI 向美国众议院中国问题特别委员会(House Select Committee on China)提交了一份备忘录,内容直指中国 AI 公司 DeepSeek 的核心开发方式——模型蒸馏(Model Distillation)。

所谓蒸馏,是指用一个更强大的「教师模型」的输出来训练一个较小的「学生模型」,使后者以更低的成本复制前者的能力。这本身是 AI 领域的常见技术,但 OpenAI 的指控重点在于:DeepSeek 是在未经授权的情况下,系统性地利用美国前沿模型的输出来训练自己的模型。

"DeepSeek 的下一个模型(无论以何种形式出现)都应该在其持续搭便车于 OpenAI 和其他美国前沿实验室所开发能力的背景下来理解。"
— 来源:Reuters,引用 OpenAI 备忘录原文

OpenAI 披露的具体手段

备忘录中,OpenAI 详细描述了 DeepSeek 员工的操作方式:

1. 混淆路由器绕过访问限制

OpenAI 声称观察到与 DeepSeek 员工关联的账户,开发了通过「混淆的第三方路由器」(obfuscated third-party routers)绕过 OpenAI 访问限制的方法,以掩盖其真实来源。

2. 编程方式批量获取模型输出

备忘录指出,DeepSeek 员工编写了专门的代码,以编程方式访问美国 AI 模型并获取输出,用于蒸馏训练。

"我们还知道,DeepSeek 员工开发了代码,以编程方式访问美国 AI 模型并获取用于蒸馏的输出。我们相信 DeepSeek 还使用第三方路由器访问其他美国实验室的前沿模型。"
— 来源:Rest of World

3. 利用未授权经销商

除了直接绕过限制,DeepSeek 还被指通过 OpenAI 服务的未授权经销商来获取模型访问权限。

OpenAI 明确表示,其服务条款禁止使用模型输出来创建「模仿前沿 AI 模型」的产品。

时机与动机

这份备忘录的提交时机值得玩味。下周就是中国农历新年,而去年正是在春节期间,DeepSeek 突然发布 R1 模型,以远低于美国同行的训练成本声称达到了可比的性能,震动了整个硅谷。

今年春节前夕,中国 AI 公司再次密集发布新模型——智谱发布 GLM-5、MiniMax 推出 M2.5、阿里通义千问发布 Qwen-Image 2.0。市场普遍预期 DeepSeek 也将在春节期间有大动作。

RAND 智库副研究员 Austin Horng-En Wang 对 OpenAI 此时发难的动机提出了质疑:

"提出指控的一个可能原因是,阻止 DeepSeek 和中国公司获取更多芯片来蒸馏美国模型,从而让美国模型保持领先地位。"
— 来源:Rest of World,Austin Horng-En Wang

行业背景:开源 vs 闭源的路线之争

这场争端的深层背景是中美 AI 发展路线的根本分歧。DeepSeek 的 R1 模型推动了中国对开源 AI 生态的全面拥抱——开发者可以自由下载、修改和部署这些模型。这与 OpenAI、Anthropic 等美国公司严格控制模型访问权限的闭源路线形成了鲜明对比。

Counterpoint Research 副总裁 Neil Shah 指出了一个尴尬的现实:

"现实是,没有任何模型是一座孤岛,整个行业基本上都是基于递归学习演进的。新进入者在很多情况下走的是同样的'蒸馏'和'优化'路线。"
— 来源:Rest of World,Neil Shah

这句话点出了一个核心矛盾:蒸馏是整个 AI 行业的通用技术,OpenAI 自己的模型训练过程中也大量使用了公开的学术成果和开源代码。当 OpenAI 指控 DeepSeek「搭便车」时,这条线究竟画在哪里?

安全隐患

OpenAI 在备忘录中还提出了一个安全层面的担忧:当蒸馏被用于复制模型能力时,原始模型内置的安全特性可能会丢失。这意味着蒸馏出的模型可能在生物、化学等敏感领域被滥用,而缺乏必要的安全护栏。

OpenAI 特别指出,这种蒸馏行为「主要与中国和俄罗斯相关」。

富贵点评

这件事表面上是知识产权纠纷,实质上是中美 AI 竞争进入了「政治化」阶段。

从技术角度看,蒸馏确实是灰色地带。OpenAI 的服务条款禁止用输出训练竞品模型,但这种条款在跨国场景下几乎无法执行。而且说实话,整个 AI 行业的发展本身就建立在「站在巨人肩膀上」的基础之上——OpenAI 自己也大量使用了互联网上的公开数据来训练模型。

但从商业角度看,OpenAI 的焦虑是真实的。当你花了几十亿美元训练出来的模型能力,被对手用几百万美元的蒸馏成本复制走,还以开源免费的方式发布出去,这对商业模式的打击是致命的。

最值得关注的是时机。OpenAI 选择在中国春节前夕、DeepSeek 可能发布新模型之际向国会告状,这不像是单纯的知识产权维权,更像是在为可能的政策干预铺路——比如进一步收紧芯片出口管制,或者限制中国公司访问美国 AI 服务。

AI 竞争正在从「谁的模型更强」变成「谁能控制游戏规则」。这场博弈的结果,可能比任何一个模型的发布都更深远。

📋 要点回顾

  • 正式指控:OpenAI 于 2 月 12 日向美国众议院中国问题特别委员会提交备忘录,指控 DeepSeek 通过蒸馏技术系统性窃取美国前沿 AI 模型能力
  • 具体手段:DeepSeek 员工被指通过混淆的第三方路由器绕过访问限制,编写代码批量获取模型输出用于蒸馏训练
  • 时机敏感:指控恰逢中国春节前夕,多家中国 AI 公司密集发布新模型,DeepSeek 也被预期将有大动作
  • 动机争议:RAND 智库分析师质疑 OpenAI 此举可能是为了阻止中国公司获取更多芯片,维护美国 AI 领先地位
  • 深层矛盾:事件折射出中美 AI 发展路线的根本分歧——中国拥抱开源免费,美国坚持闭源付费,蒸馏技术的合法边界成为核心争议

❓ 常见问题

Q: 什么是模型蒸馏(Model Distillation)?

A: 模型蒸馏是一种机器学习技术,通过让一个较小的「学生模型」学习一个更强大的「教师模型」的输出,来复制后者的能力。这样可以用更低的计算成本获得接近大模型的性能。这项技术本身是合法且广泛使用的,争议在于是否在未经授权的情况下使用了他人的商业模型作为「教师」。

Q: OpenAI 的指控有法律效力吗?

A: 目前这只是一份提交给国会委员会的备忘录,不是法律诉讼。OpenAI 的服务条款确实禁止使用模型输出训练竞品,但这种条款在跨国场景下的执行力非常有限。这更像是一种政治游说行为,旨在推动更严格的政策管制。

Q: DeepSeek 对此有何回应?

A: 截至目前,DeepSeek 尚未公开回应 OpenAI 的指控,也未确认任何新模型的发布计划。DeepSeek 的母公司是量化对冲基金幻方量化(High-Flyer),由梁文锋创立,估值约 80 亿美元。

作者:王富贵 | 发布时间:2026年2月14日

参考来源:Reuters · Rest of World · WinBuzzer · Bloomberg