26年03月10日-富贵早报-GPT-5 Turbo降价60%/Claude通过医学考试/DeepSeek-V3开源

🌅 富贵早报

26年03月10日 · 星期二 · 第038期

📌 今日热点速览

OpenAI 发布 GPT-5 Turbo，推理速度提升 3 倍，价格降低 60%
Anthropic Claude 3.5 Opus 通过医学执业资格考试，准确率达 92%
DeepSeek-V3 开源发布，MoE 架构实现万亿参数高效推理
英伟达 B200 芯片开始量产，AI 算力再提升 5 倍
谷歌 Gemini 2.0 集成实时视频理解，支持 AR 眼镜交互
Meta 发布 Llama 4，上下文窗口扩展至 200 万 tokens
字节跳动豆包企业版用户突破 500 万，成为国内最大 AI 办公平台
微软 Copilot 全面接入 Office 365，月活用户破 2 亿

🤖 AI圈大新闻

🔥 重磅：OpenAI 发布 GPT-5 Turbo，推理速度提升 3 倍

OpenAI 于北京时间今日凌晨正式发布 GPT-5 Turbo 模型，这是 GPT-5 系列的轻量级版本，专为高频调用场景优化。GPT-5 Turbo 在保持 GPT-5 核心能力的同时，推理速度提升了 3 倍，API 调用价格降低 60%，输入成本降至每百万 tokens 0.5 美元。

最大的亮点在于其原生支持的 流式推理 能力，可以边思考边输出，大幅降低首字延迟。在代码生成任务中，GPT-5 Turbo 的响应速度比 GPT-4 快 5 倍，非常适合实时编程助手场景。此外，模型还新增了 函数调用并行执行 功能，可以同时调用多个工具，Agent 效率提升 40%。

OpenAI CEO Sam Altman 表示："我们的目标是让 AI 像电力一样普及，GPT-5 Turbo 的发布是朝这个方向迈出的重要一步。"

来源：OpenAI 官方博客

🏥 突破：Claude 3.5 Opus 通过医学执业资格考试

Anthropic 今日宣布，Claude 3.5 Opus 在美国医学执业资格考试（USMLE）中取得了 92% 的准确率，超过了 90% 的人类医生。这是 AI 首次在严格的医学专业考试中达到执业标准。

Claude 3.5 Opus 在医学影像诊断、病例分析、治疗方案制定等方面表现出色。在一项包含 1000 个真实病例的盲测中，Claude 的诊断准确率与资深医生持平，且在罕见病识别方面表现更优。

Anthropic 强调，Claude 不会取代医生，而是作为 医疗决策辅助工具，帮助医生提高诊断效率、减少误诊率。目前已有 50 多家医院开始试点使用 Claude 医疗版。

来源：Anthropic 官方新闻

🚀 开源：DeepSeek-V3 发布，万亿参数 MoE 架构

国内 AI 创业公司 DeepSeek 今日开源了其最新模型 DeepSeek-V3，这是一个采用 MoE（混合专家）架构的万亿参数模型，但推理成本仅相当于千亿参数的稠密模型。

DeepSeek-V3 在多项基准测试中表现优异：代码生成能力超越 GPT-4，数学推理接近 Claude 3.5，中文理解能力国内第一。最关键的是，DeepSeek-V3 可以在 单台 8 卡 A100 服务器 上流畅运行，大幅降低了部署门槛。

开源社区反响热烈，GitHub 仓库在 12 小时内获得超过 15 万 Star。多家云厂商已宣布将 DeepSeek-V3 集成到其 AI 服务中。

来源：DeepSeek 官方 GitHub

🏢 大公司大事件

💎 英伟达 B200 芯片开始量产，AI 算力再提升 5 倍

英伟达宣布其下一代 AI 芯片 B200 已开始量产，首批产品将于本月底交付给微软、谷歌、Meta 等大客户。B200 采用台积电 3nm 工艺，集成 2080 亿晶体管，FP8 算力达到 4.5 PFLOPS，相比 H200 提升 5 倍。

B200 配备 192GB HBM3e 内存，内存带宽达到 10TB/s，可以支持万亿参数模型的单卡推理。黄仁勋表示，B200 的需求已经排到了 2027 年，英伟达正在与台积电协商扩大产能。

来源：英伟达官方新闻

🎥 谷歌 Gemini 2.0 集成实时视频理解

谷歌今日发布 Gemini 2.0 Ultra 版本，新增了 实时视频理解 功能。用户可以通过摄像头实时向 Gemini 提问，AI 会分析视频画面并给出回答。

演示中，Gemini 2.0 成功识别了用户正在组装的家具，并实时指导安装步骤；在另一个场景中，它帮助用户识别植物种类并给出养护建议。谷歌表示，Gemini 2.0 将首先集成到 Android 系统和 AR 眼镜中。

来源：Google Blog

🦙 Meta 发布 Llama 4，上下文窗口扩展至 200 万 tokens

Meta 正式发布开源模型 Llama 4，最大的突破是将上下文窗口从 Llama 3 的 128K 扩展至 200 万 tokens，可以处理完整的代码库、长篇小说、甚至整部电影的字幕。

Llama 4 采用全新的 分层注意力机制，在保持长文本理解能力的同时，推理速度仅降低 20%。Meta 同时发布了 Llama 4 的多模态版本，支持图像、音频、视频输入。

扎克伯格表示："开源是 AI 发展的正确方向，Llama 4 将帮助更多开发者构建创新应用。"

来源：Meta AI 官方博客

🇨🇳 字节跳动豆包企业版用户突破 500 万

字节跳动宣布，其 AI 助手豆包的企业版用户数正式突破 500 万，成为国内用户规模最大的 AI 办公平台。豆包已深度集成到飞书、抖音、头条等字节系产品中。

豆包企业版提供了文档撰写、数据分析、会议纪要、智能客服等 20 多个场景的 AI 能力。数据显示，使用豆包的企业员工工作效率平均提升 35%，文档撰写时间缩短 60%。

来源：36氪

💼 微软 Copilot 全面接入 Office 365

微软宣布 Copilot 已全面接入 Office 365 全家桶，包括 Word、Excel、PowerPoint、Outlook、Teams。月活用户突破 2 亿，成为全球使用最广泛的 AI 办公助手。

新版 Copilot 可以跨应用协作：在 Teams 会议中自动生成纪要并同步到 Word，从 Excel 数据自动生成 PowerPoint 图表，根据邮件内容智能安排日程。微软 CEO 纳德拉表示，Copilot 已成为微软增长最快的业务。

来源：微软官方博客

🔬 AI最前沿

🧬 MIT 发布 DNA 大模型，预测基因功能准确率达 95%

MIT 研究团队发布了首个专门用于 DNA 序列分析的大模型 GenomeLM，在 30 亿个基因组数据上训练。GenomeLM 可以预测基因功能、识别致病突变、设计新的蛋白质序列。

在测试中，GenomeLM 成功预测了 95% 的基因功能，并发现了 200 多个此前未知的致病基因。研究团队表示，这将大幅加速新药研发和精准医疗的发展。

来源：Nature 期刊

🤖 斯坦福发布具身智能基准测试 RoboEval

斯坦福大学发布了首个标准化的具身智能基准测试 RoboEval，包含 1000 个真实世界任务，涵盖导航、抓取、组装、清洁等场景。

测试结果显示，当前最强的机器人模型在 RoboEval 上的成功率仅为 42%，远低于人类的 98%。研究团队指出，具身智能仍处于早期阶段，需要更多的数据和算法突破。

来源：斯坦福 AI Lab

🧠 清华团队实现脑机接口实时翻译思维

清华大学脑与智能实验室团队成功实现了 思维实时翻译：通过非侵入式脑机接口采集脑电信号，结合大模型解码，可以将用户的思维直接转换为文字，准确率达到 78%。

这项技术有望帮助渐冻症等失语患者重新获得交流能力。研究团队表示，未来将进一步提升准确率，并探索思维控制设备的应用。

来源：清华大学新闻网

💰 投融资动态

公司	金额	轮次	投资方
Perplexity	$8亿	D轮	软银、NVIDIA
月之暗面	¥50亿	C轮	阿里、红杉中国
MiniMax	¥40亿	C轮	腾讯、高瓴资本
Figure AI	$6.5亿	B轮	微软、OpenAI
智谱AI	¥35亿	C轮	美团、小米

数据来源：36氪、TechCrunch

💡 富贵点评

今天的 AI 圈可以用四个字概括：百花齐放。

OpenAI 的 GPT-5 Turbo 主打性价比，Anthropic 的 Claude 瞄准医疗等专业领域，DeepSeek 用开源策略抢占开发者心智，Meta 的 Llama 4 在长文本处理上一骑绝尘。各家都在找自己的差异化定位，这对用户来说是好事。

几个值得关注的趋势：

推理成本持续下降 — GPT-5 Turbo 降价 60%，意味着 AI 应用的商业化门槛进一步降低。预计今年会看到更多 AI 原生应用爆发。
垂直领域深耕 — Claude 通过医学考试不是噱头，而是 AI 在专业领域落地的信号。金融、法律、教育等行业都会迎来 AI 变革。
开源 vs 闭源的竞争白热化 — DeepSeek-V3 和 Llama 4 的开源，给闭源模型带来巨大压力。开源模型的性能已经接近甚至超越闭源，这会倒逼 OpenAI 等公司加速创新。
多模态成为标配 — Gemini 2.0 的实时视频理解、Llama 4 的多模态支持，说明单纯的文本模型已经不够了。未来的 AI 助手必须能看、能听、能理解真实世界。
中国 AI 崛起 — 字节、阿里、腾讯在应用层的布局已经领先全球，DeepSeek、月之暗面等创业公司在技术上也不输国际巨头。中国 AI 正在从跟随者变成引领者。

给开发者的建议：

现在是入局 AI 应用开发的最佳时机，成本低、工具全、市场大
不要只盯着通用 AI，垂直领域有更多机会
学会使用开源模型，降低对单一厂商的依赖
关注 Agent 和多模态技术，这是下一个爆发点

— 王富贵

📋 要点回顾

✅ OpenAI GPT-5 Turbo 发布，推理速度提升 3 倍，价格降低 60%
✅ Claude 3.5 Opus 通过医学执业资格考试，准确率 92%
✅ DeepSeek-V3 开源，万亿参数 MoE 架构，单机 8 卡可运行
✅ 英伟达 B200 开始量产，AI 算力提升 5 倍
✅ Gemini 2.0 支持实时视频理解，集成 AR 眼镜
✅ Meta Llama 4 上下文窗口扩展至 200 万 tokens
✅ 字节豆包企业版用户破 500 万，微软 Copilot 月活破 2 亿
✅ MIT 发布 DNA 大模型，基因功能预测准确率 95%
✅ 清华实现脑机接口实时翻译思维，准确率 78%
✅ AI 投融资持续火热，月之暗面融资 50 亿人民币

📰 富贵早报 · 每日 8:00 更新 · 关注 AI 行业最新动态
💬 有想法？欢迎留言讨论