📌 一句话总结:OpenAI 向美国国会提交备忘录,正式指控 DeepSeek 通过「蒸馏」技术窃取美国前沿 AI 模型的能力——但这场指控的背后,可能远不止知识产权那么简单。
2026年2月15日 · 深度解读 · 阅读时间约 8 分钟
事件始末:一份备忘录引爆的风暴
2026 年 2 月 12 日,OpenAI 向美国众议院中国问题特别委员会提交了一份备忘录。这份文件的核心指控只有一个:DeepSeek 正在通过「蒸馏」(distillation)技术,系统性地从 OpenAI 及其他美国前沿 AI 实验室的模型中提取能力,用于训练自己的下一代模型。
备忘录中写道:
「我们观察到与 DeepSeek 员工关联的账户正在开发绕过 OpenAI 访问限制的方法,通过混淆的第三方路由器和其他方式掩盖其来源来访问模型。」
— 来源:Reuters
OpenAI 还声称,DeepSeek 员工编写了专门的代码,以编程方式访问美国 AI 模型并获取输出用于蒸馏。此外,还存在「未经授权的 OpenAI 服务转售商」网络,同样被用于规避控制。
这不是 OpenAI 第一次提出类似指控。早在 2025 年 1 月 DeepSeek R1 发布后,OpenAI 就联合微软展开了调查。但这一次,他们选择了一个更高调的方式——直接向国会喊话。
什么是「蒸馏」?为什么它成了争议焦点
在 AI 领域,「蒸馏」是一种被广泛使用的技术。简单来说,就是让一个小模型(学生模型)通过学习大模型(教师模型)的输出来获得类似的能力。这就像一个学生不去读教科书,而是直接抄学霸的作业——虽然没有经历完整的学习过程,但结果看起来差不多。
蒸馏本身并不违法,也不罕见。事实上,几乎所有主流 AI 公司都在内部使用蒸馏技术来压缩和优化自己的模型。苹果的端侧 AI、谷歌的轻量级模型,背后都有蒸馏的影子。
争议的关键在于:你蒸馏的是谁的模型?有没有获得授权?
OpenAI 的服务条款明确禁止用户利用其模型输出来创建「模仿前沿 AI 模型」的竞品。如果 DeepSeek 确实通过大量自动化查询来收集 OpenAI 模型的响应,并将这些数据用于训练,那就不是技术问题,而是合规问题了。
技术手段:比想象中更复杂
根据备忘录披露的细节,DeepSeek 的蒸馏操作并非简单的「调用 API 抄答案」。OpenAI 描述了一套相当精密的规避体系:
| 手段 | 具体方式 |
|---|---|
| 第三方路由器混淆 | 通过中间代理服务器访问 OpenAI API,隐藏真实来源 |
| 编程化批量访问 | 编写自动化代码大规模获取模型输出 |
| 未授权转售商网络 | 利用第三方转售渠道绕过 OpenAI 的直接管控 |
| 新型混淆方法 | 持续开发新的规避手段以应对 OpenAI 的封堵 |
OpenAI 将这些行为定性为「系统性的搭便车」(systematic free-riding),而非偶发的违规使用。这意味着在 OpenAI 看来,这不是几个员工的个人行为,而是有组织、有计划的技术窃取。
时机耐人寻味:为什么是现在?
兰德公司副研究员 Austin Horng-En Wang 提出了一个尖锐的问题:OpenAI 为什么选择在这个时间点升级指控?
几个背景值得注意:
第一,DeepSeek 可能即将发布新模型。多家媒体报道,DeepSeek 正在开发一个基于 Agent 的新模型,原计划在 2025 年底发布,现在可能在农历新年期间亮相——就像去年 R1 的「突袭式发布」一样。OpenAI 在新模型发布前抢先定调,试图在舆论上先发制人。
第二,中国开源 AI 生态正在加速。过去一个月,智谱发布了 GLM-5(744 亿参数,编程能力逼近 GPT-5.2),MiniMax 推出了 M2.5,中国 AI 公司正在集体冲刺。OpenAI 需要一个叙事来解释为什么中国模型进步如此之快——「他们抄了我们的」显然比「他们真的很强」更容易被接受。
第三,芯片出口管制正在松动。特朗普政府已经放宽了对 Nvidia H200 芯片的出口限制。OpenAI 的备忘录实际上也在向国会传递一个信号:如果连软件层面的知识产权都保护不了,放开硬件出口只会让情况更糟。
「指控的一个可能原因是阻止 DeepSeek 和中国公司获取更多芯片来蒸馏美国模型,从而让美国模型保持领先地位。」
— Austin Horng-En Wang,兰德公司副研究员,来源:Rest of World
更深层的矛盾:闭源 vs 开源的路线之争
这场争端的底层,其实是两种 AI 发展路线的根本冲突。
OpenAI、Anthropic 等美国公司走的是闭源路线:投入数十亿美元训练模型,通过付费订阅和 API 调用来回收成本。这个商业模式的前提是——模型的能力是独占的,别人无法轻易复制。
而 DeepSeek 及大量中国 AI 公司走的是开源路线:模型权重公开,任何人都可以下载、修改、部署。R1 的成功证明了一件事——用更少的算力、更低的成本,也能做出接近前沿水平的模型。
当开源模型的能力逼近闭源模型时,闭源公司的护城河就开始动摇了。如果用户可以免费使用一个 90 分的开源模型,为什么要每月花 200 美元订阅一个 95 分的闭源模型?
Counterpoint Research 副总裁 Neil Shah 的评论一针见血:
「现实是,没有任何模型是一座孤岛,整个行业基本上都是基于递归学习演进的。新进入者在很多情况下走的是同样的'蒸馏'和'优化'路线。」
— Neil Shah,Counterpoint Research,来源:Rest of World
这句话点出了一个尴尬的事实:蒸馏在整个 AI 行业中无处不在。OpenAI 自己的模型训练过程中,是否完全没有参考过其他模型的输出?这个问题恐怕没有人能给出干净的答案。
安全隐患:被忽视的另一面
OpenAI 在备忘录中还提到了一个容易被忽略但非常重要的问题:当模型能力通过蒸馏被复制时,原始模型内置的安全护栏往往会丢失。
这意味着什么?一个经过精心调教、在生物学和化学等敏感领域设置了严格限制的模型,在被蒸馏后可能会失去这些保护。蒸馏出来的模型可能保留了「能力」,但丢掉了「约束」。
此外,OpenAI 还指出 DeepSeek 的聊天机器人会审查涉及台湾、天安门等中国政府认为敏感的话题。当一个带有内容审查机制的模型获得了前沿级别的能力,其潜在影响值得警惕。
富贵点评
说实话,这件事我觉得双方都有「不能说的秘密」。
OpenAI 的指控可能有事实基础——蒸馏确实是一种低成本获取能力的捷径,而且绕过 API 限制的行为如果属实,确实违反了服务条款。但把这件事上升到国会层面,显然不只是为了维权。OpenAI 正面临前所未有的竞争压力:中国开源模型越来越强,自家的商业模式受到挑战,Anthropic 刚拿了 300 亿美元融资,微软也在自研模型……在这个节骨眼上,「中国人偷了我们的技术」是一个太好用的叙事了。
但反过来说,如果 DeepSeek 真的在系统性地规避限制、大规模蒸馏美国模型,那这确实不是什么光彩的事。技术可以开源,但「偷」和「借鉴」之间是有界限的。
最让我感慨的是 Neil Shah 那句话:「没有任何模型是一座孤岛。」AI 的发展本质上就是站在前人肩膀上的递归过程。当 OpenAI 用互联网上的公开数据训练 GPT 时,有多少内容创作者同意了?当整个行业都在「借鉴」时,谁来画那条线?
这场争端的结局,可能不会是某一方的胜利,而是整个行业被迫建立新的规则。就像当年的开源软件运动最终催生了 GPL、MIT 等许可证体系一样,AI 行业也需要自己的「知识产权协议」。在那之前,这种互相指控只会越来越多。
📋 要点回顾
- 正式指控:OpenAI 于 2 月 12 日向美国众议院中国问题特别委员会提交备忘录,指控 DeepSeek 通过蒸馏技术系统性窃取美国前沿 AI 模型能力
- 技术手段:DeepSeek 被指使用第三方路由器混淆、编程化批量访问、未授权转售商网络等多种方式绕过 OpenAI 的安全限制
- 时机敏感:指控发生在 DeepSeek 可能发布新模型前夕,同时中国开源 AI 生态正在加速发展,美国芯片出口管制也在松动
- 深层矛盾:本质上是闭源商业模式与开源生态之间的路线之争,蒸馏技术的广泛使用让知识产权边界变得模糊
- 安全隐患:蒸馏可能导致原始模型的安全护栏丢失,带有内容审查机制的模型获得前沿能力后存在潜在风险
❓ 常见问题
Q: 什么是 AI 模型蒸馏?它和普通的模型训练有什么区别?
A: 蒸馏是让一个小模型通过学习大模型的输出来获得类似能力的技术。与从零开始用原始数据训练不同,蒸馏相当于「抄学霸的作业」——跳过了昂贵的训练过程,直接从成熟模型的回答中学习。这种方法成本低、速度快,但依赖于对源模型输出的访问权限。
Q: OpenAI 的指控有法律效力吗?DeepSeek 会面临什么后果?
A: 目前这份备忘录是提交给国会的政策建议,不是法律诉讼。但它可能推动更严格的 AI 知识产权立法和出口管制政策。由于 DeepSeek 是中国公司,美国法律的直接管辖力有限,更可能的后果是加强技术封锁和芯片出口限制。
Q: 蒸馏在 AI 行业中普遍吗?只有中国公司在做吗?
A: 蒸馏是 AI 行业中非常普遍的技术,几乎所有公司都在内部使用。苹果的端侧 AI、谷歌的轻量级模型都用到了蒸馏。争议的焦点不在于蒸馏本身,而在于是否未经授权使用了他人模型的输出。OpenAI 的备忘录主要将这种行为与中国和俄罗斯关联,但行业分析师指出「整个行业都是基于递归学习演进的」。
Q: 这件事对普通用户有什么影响?
A: 短期内对普通用户影响不大。但长期来看,如果美中 AI 竞争进一步升级,可能导致:API 访问限制更严格、AI 服务价格上涨、某些地区无法使用特定 AI 产品。另一方面,竞争也在推动技术进步——无论是闭源还是开源阵营,都在加速迭代,最终受益的还是用户。
作者:王富贵 | 发布时间:2026年2月15日
参考来源:Reuters · Rest of World · Los Angeles Times · WinBuzzer · NDTV