📌 一句话总结:ChatGPT Deep Research 迎来一周年最大升级,底层换装 GPT-5.2、新增网站定向搜索和 MCP 应用连接、支持实时干预和可编辑研究计划——从「自动搜索引擎」进化为「协作式研究伙伴」,OpenAI 正在用「人机协作」重新定义 AI 做研究的方式。
2026年2月13日 · 深度解读 · 阅读时间约 8 分钟
一年前的承诺,今天兑现了多少?
2025 年 2 月,OpenAI 发布了 Deep Research 的首个版本,当时的卖点很简单:给它一个问题,它会自主浏览网页 5-30 分钟,然后交出一份带引用的研究报告。底层跑的是 o3 模型,后来又加了一个轻量版 o4-mini。
一年过去了,Deep Research 的核心问题也暴露得越来越清楚:
- 你无法控制它去哪些网站找信息——在提示词里写「只搜 PubMed」,它可能还是会跑去随机博客
- 研究计划是 AI 自动生成的,你只能在它开始跑之后才能「纠偏」
- 整个过程像个黑箱——点击「开始」之后,你只能等
- 报告嵌在聊天窗口里,长文档的阅读体验很糟糕
- 无法接入私有数据源,Google Drive 和 SharePoint 里的文件只能手动上传
2 月 10 日的这次升级,几乎逐条回应了这些痛点。
五大核心变化:不只是换了个模型
1. 底层模型:从 o3 到 GPT-5.2
这是最底层的变化。GPT-5.2 相比 o3 在上下文保持能力和逻辑推演上有显著提升。具体到 Deep Research 场景,这意味着:
- 在 5-30 分钟的长时间研究过程中,模型不容易「忘记」前面收集到的信息
- 面对复杂问题时,能更好地将大问题拆解为子查询,系统性地填补信息空白
- 长输出中的「幻觉」发生率降低(虽然没有完全消除)
值得注意的是,OpenAI 同时更新了 GPT-5.2 Instant 模型,官方说法是「回答更加沉稳、接地气,语境适配更好」。这暗示 OpenAI 正在有意识地调整模型的「人格」——从「什么都想说」变成「说该说的」。
2. 网站定向搜索:终于不用在提示词里「求」它了
这是用户呼声最高的功能。现在你可以通过 Sites > Manage sites 直接设置:
| 模式 | 行为 | 适用场景 |
|---|---|---|
| 完全限制(Limit) | 只在指定网站搜索 | 学术研究、合规调查 |
| 优先搜索(Prioritise) | 优先指定网站,不够再扩展 | 行业分析、竞品调研 |
这个改动看似简单,实际意义重大。对于医学研究者来说,能把搜索范围锁定在 PubMed 和 arXiv,意味着报告的可信度从「参考」级别提升到了「可引用」级别。对于律师和合规人员,能限定在特定法律数据库搜索,直接影响工作产出的专业性。
3. MCP 协议连接第三方应用:打破「只能搜公开网页」的天花板
这可能是最被低估的一个升级。通过 Model Context Protocol(MCP),Deep Research 现在可以以只读模式连接 Google Drive、SharePoint 等第三方应用作为可信数据源。
这意味着什么?以前 Deep Research 只能搜公开互联网,你公司内部的文档、数据库、知识库它碰不到。现在,它可以同时查阅公开资料和你的私有数据,生成一份「内外结合」的研究报告。
想象一个场景:你是一家药企的研究员,需要评估某个新靶点的商业前景。以前你得分别在 PubMed 搜论文、在公司内网查专利库、在 CRM 里看竞品动态,然后自己整合。现在,Deep Research 可以一次性完成这三步。
— 来源:综合多家科技媒体报道分析
4. 可编辑研究计划 + 实时干预:从「发射后不管」到「全程协作」
这是理念层面最大的转变。
旧版 Deep Research 的工作流是线性的:你提问 → AI 自动生成研究计划 → 自动执行 → 交付报告。你唯一能做的就是在它跑起来之后「纠偏」,但如果研究方向一开始就跑偏了,你只能重来。
新版加入了两个关键能力:
- 研究计划可在执行前编辑——你可以审查 AI 的研究思路,调整方向、增删子课题
- 执行过程中可实时干预——看到它在查某个不相关的网站?直接打断,指向新的来源
这把 Deep Research 从一个「自动化工具」变成了一个「协作伙伴」。你不再是被动等待结果的客户,而是全程参与的研究搭档。
5. 全屏报告查看器:终于像个正经研究工具了
新的报告界面采用三栏布局:左侧目录索引、中间正文、右侧引用面板。支持点击目录跳转、全屏阅读、导出 PDF/DOCX。
这个改动的意义不在于技术难度,而在于它传递的信号:OpenAI 不再把 Deep Research 当作聊天机器人的一个「附加功能」,而是在把它打造成一个独立的专业研究工具。
竞争格局:三方混战的「AI 研究助手」赛道
Deep Research 的升级不是发生在真空中的。让我们看看它面对的竞争环境:
| 产品 | 核心优势 | 短板 |
|---|---|---|
| ChatGPT Deep Research | GPT-5.2 推理能力、MCP 生态、用户基数 | Pro 用户限 100 次/月,价格门槛高 |
| Google Gemini Deep Research | Google 搜索生态、实时数据更新鲜 | 报告深度不如 ChatGPT |
| Perplexity | 多模型集成、引用透明度高 | 缺乏长时间自主研究能力 |
有意思的是,三家的策略完全不同:
- OpenAI 押注「深度」——让 AI 花 30 分钟做一次彻底的研究
- Google 押注「广度」——利用搜索引擎的先天优势覆盖更多来源
- Perplexity 押注「速度」——快速给出带引用的答案,不追求长报告
而这次升级后,OpenAI 实际上在「深度」的基础上补齐了「精度」(网站定向)和「协作性」(实时干预),形成了更完整的产品形态。
更深层的信号:从 o3 到 GPT-5.2 的模型路线之争
一个容易被忽略的细节是:Deep Research 的底层模型经历了 o3 → o4-mini → GPT-5.2 的演变。这条路线本身就很有意思。
o3 和 o4-mini 属于 OpenAI 的「推理模型」系列,擅长逻辑推演和多步骤思考。而 GPT-5.2 是「通用模型」系列的最新成员。OpenAI 选择用通用模型替换推理模型来驱动 Deep Research,说明了什么?
一种解读是:GPT-5.2 的通用能力已经强到不需要专门的推理模型了。当通用模型的推理能力追上甚至超过专用推理模型时,维护两条模型线的意义就大打折扣。
另一种解读是:Deep Research 需要的不仅仅是「推理」,还有语言组织、格式化输出、多模态理解等综合能力,而这些恰恰是通用模型的强项。
无论哪种解读,这都暗示 OpenAI 内部的模型策略可能正在收敛——未来的方向可能不是「通用模型 + 推理模型」的双轨制,而是一个足够强大的通用模型覆盖所有场景。
对普通用户意味着什么?
如果你是 ChatGPT Pro 用户(每月 200 美元),这次升级直接提升了你每月 100 次 Deep Research 查询的价值。特别是网站定向搜索和 MCP 连接,让 Deep Research 从「有趣的玩具」变成了「可以交付工作成果的工具」。
如果你是 Plus 用户(每月 20 美元),好消息是 OpenAI 表示 Plus、Team 和 Enterprise 用户将陆续获得访问权限,而且会有「更快、更优化的版本和更高的使用限额」。
如果你是免费用户,目前还需要等待。但 OpenAI 此前已经将 Deep Research 的轻量版开放给免费用户,这次升级的功能大概率也会逐步下放。
不过,真正值得关注的不是某个具体功能,而是这次升级传递的产品哲学:AI 研究工具的未来不是「全自动」,而是「人机协作」。最好的 AI 研究助手不是替你思考,而是在你思考的过程中提供精准的信息支持,同时让你始终保持对研究方向的控制权。
富贵点评
说实话,Deep Research 刚出来的时候我是有点失望的——等半小时出一份报告,结果里面混着不靠谱的来源,还没法控制它去哪找信息。感觉就像雇了一个很勤快但不听指挥的实习生。
这次升级最让我眼前一亮的不是 GPT-5.2(模型升级是预期之内的事),而是「可编辑研究计划」和「实时干预」。这说明 OpenAI 想明白了一件事:对于严肃的研究工作,用户要的不是「全自动」,而是「我说了算,但你帮我干活」。
MCP 连接第三方应用这个功能,短期看是锦上添花,长期看可能是最具颠覆性的。一旦 Deep Research 能同时查阅公开互联网和企业内部知识库,它就不再是一个「搜索增强工具」,而是一个真正的「企业级研究平台」。这也解释了为什么 OpenAI 把 Enterprise 用户列在了优先开放名单里。
不过,每月 100 次的使用限制还是太抠了。对于真正的研究密集型用户来说,100 次可能一周就用完了。希望 OpenAI 在商业化和用户体验之间找到更好的平衡点。
📋 要点回顾
- 模型升级:底层从 o3/o4-mini 切换至 GPT-5.2,上下文保持和逻辑推演能力显著提升,长输出幻觉率降低
- 网站定向搜索:支持「完全限制」和「优先搜索」两种模式,可将研究范围锁定在 PubMed、arXiv 等可信来源
- MCP 应用连接:通过 Model Context Protocol 以只读模式接入 Google Drive、SharePoint 等私有数据源
- 人机协作升级:研究计划可在执行前编辑,执行过程中支持实时干预、追问和重定向
- 专业化报告:全屏三栏布局(目录/正文/引用),支持 PDF/DOCX 导出,向独立研究工具形态演进
- 竞争格局:OpenAI 押注「深度+精度」,Google 押注「广度」,Perplexity 押注「速度」,三方策略分化明显
❓ 常见问题
Q: ChatGPT Deep Research 升级后免费用户能用吗?
A: 目前最新版 Deep Research 仅对 Pro 用户开放(每月 100 次查询),Plus、Team 和 Enterprise 用户将陆续获得访问权限。免费用户暂时只能使用此前开放的轻量版 Deep Research,但新功能预计会逐步下放。
Q: 网站定向搜索和直接在提示词里写「只搜某网站」有什么区别?
A: 区别很大。在提示词里写只是「建议」,AI 可能不遵守;而通过 Sites > Manage sites 设置的是系统级限制,AI 必须遵守。「完全限制」模式下,搜索结果只会来自你指定的网站,不会出现不相关来源。
Q: MCP 连接第三方应用安全吗?会不会泄露我的私有数据?
A: OpenAI 表示连接的应用以「只读模式」接入,Deep Research 只能读取数据用于研究,不能修改或删除。但具体的数据处理和隐私政策还需要关注 OpenAI 后续的详细说明,特别是企业用户应评估是否符合自身的数据合规要求。
Q: 从 o3 换成 GPT-5.2 后,Deep Research 的研究质量提升有多大?
A: OpenAI 没有公布具体的基准测试对比数据。从多家媒体的实测反馈来看,GPT-5.2 在长时间研究任务中的上下文保持能力明显更好,生成报告的结构性和引用准确性有提升,但「幻觉」问题并未完全消除。整体而言是一次实质性的质量提升,但不是质变。
作者:王富贵 | 发布时间:2026年2月13日
参考来源:WinBuzzer · Gadgets360 · ETV Bharat · OpenTools