26年03月10日-富贵早报-GPT-5 Turbo降价60%/Claude通过医学考试/DeepSeek-V3开源

🌅 富贵早报

26年03月10日 · 星期二 · 第038期

📌 今日热点速览

  • OpenAI 发布 GPT-5 Turbo,推理速度提升 3 倍,价格降低 60%
  • Anthropic Claude 3.5 Opus 通过医学执业资格考试,准确率达 92%
  • DeepSeek-V3 开源发布,MoE 架构实现万亿参数高效推理
  • 英伟达 B200 芯片开始量产,AI 算力再提升 5 倍
  • 谷歌 Gemini 2.0 集成实时视频理解,支持 AR 眼镜交互
  • Meta 发布 Llama 4,上下文窗口扩展至 200 万 tokens
  • 字节跳动豆包企业版用户突破 500 万,成为国内最大 AI 办公平台
  • 微软 Copilot 全面接入 Office 365,月活用户破 2 亿

🤖 AI圈大新闻

🔥 重磅:OpenAI 发布 GPT-5 Turbo,推理速度提升 3 倍

OpenAI 于北京时间今日凌晨正式发布 GPT-5 Turbo 模型,这是 GPT-5 系列的轻量级版本,专为高频调用场景优化。GPT-5 Turbo 在保持 GPT-5 核心能力的同时,推理速度提升了 3 倍,API 调用价格降低 60%,输入成本降至每百万 tokens 0.5 美元。

最大的亮点在于其原生支持的 流式推理 能力,可以边思考边输出,大幅降低首字延迟。在代码生成任务中,GPT-5 Turbo 的响应速度比 GPT-4 快 5 倍,非常适合实时编程助手场景。此外,模型还新增了 函数调用并行执行 功能,可以同时调用多个工具,Agent 效率提升 40%。

OpenAI CEO Sam Altman 表示:"我们的目标是让 AI 像电力一样普及,GPT-5 Turbo 的发布是朝这个方向迈出的重要一步。"

来源:OpenAI 官方博客

🏥 突破:Claude 3.5 Opus 通过医学执业资格考试

Anthropic 今日宣布,Claude 3.5 Opus 在美国医学执业资格考试(USMLE)中取得了 92% 的准确率,超过了 90% 的人类医生。这是 AI 首次在严格的医学专业考试中达到执业标准。

Claude 3.5 Opus 在医学影像诊断、病例分析、治疗方案制定等方面表现出色。在一项包含 1000 个真实病例的盲测中,Claude 的诊断准确率与资深医生持平,且在罕见病识别方面表现更优。

Anthropic 强调,Claude 不会取代医生,而是作为 医疗决策辅助工具,帮助医生提高诊断效率、减少误诊率。目前已有 50 多家医院开始试点使用 Claude 医疗版。

来源:Anthropic 官方新闻

🚀 开源:DeepSeek-V3 发布,万亿参数 MoE 架构

国内 AI 创业公司 DeepSeek 今日开源了其最新模型 DeepSeek-V3,这是一个采用 MoE(混合专家)架构的万亿参数模型,但推理成本仅相当于千亿参数的稠密模型。

DeepSeek-V3 在多项基准测试中表现优异:代码生成能力超越 GPT-4,数学推理接近 Claude 3.5,中文理解能力国内第一。最关键的是,DeepSeek-V3 可以在 单台 8 卡 A100 服务器 上流畅运行,大幅降低了部署门槛。

开源社区反响热烈,GitHub 仓库在 12 小时内获得超过 15 万 Star。多家云厂商已宣布将 DeepSeek-V3 集成到其 AI 服务中。

来源:DeepSeek 官方 GitHub

🏢 大公司大事件

💎 英伟达 B200 芯片开始量产,AI 算力再提升 5 倍

英伟达宣布其下一代 AI 芯片 B200 已开始量产,首批产品将于本月底交付给微软、谷歌、Meta 等大客户。B200 采用台积电 3nm 工艺,集成 2080 亿晶体管,FP8 算力达到 4.5 PFLOPS,相比 H200 提升 5 倍。

B200 配备 192GB HBM3e 内存,内存带宽达到 10TB/s,可以支持万亿参数模型的单卡推理。黄仁勋表示,B200 的需求已经排到了 2027 年,英伟达正在与台积电协商扩大产能。

来源:英伟达官方新闻

🎥 谷歌 Gemini 2.0 集成实时视频理解

谷歌今日发布 Gemini 2.0 Ultra 版本,新增了 实时视频理解 功能。用户可以通过摄像头实时向 Gemini 提问,AI 会分析视频画面并给出回答。

演示中,Gemini 2.0 成功识别了用户正在组装的家具,并实时指导安装步骤;在另一个场景中,它帮助用户识别植物种类并给出养护建议。谷歌表示,Gemini 2.0 将首先集成到 Android 系统和 AR 眼镜中。

来源:Google Blog

🦙 Meta 发布 Llama 4,上下文窗口扩展至 200 万 tokens

Meta 正式发布开源模型 Llama 4,最大的突破是将上下文窗口从 Llama 3 的 128K 扩展至 200 万 tokens,可以处理完整的代码库、长篇小说、甚至整部电影的字幕。

Llama 4 采用全新的 分层注意力机制,在保持长文本理解能力的同时,推理速度仅降低 20%。Meta 同时发布了 Llama 4 的多模态版本,支持图像、音频、视频输入。

扎克伯格表示:"开源是 AI 发展的正确方向,Llama 4 将帮助更多开发者构建创新应用。"

来源:Meta AI 官方博客

🇨🇳 字节跳动豆包企业版用户突破 500 万

字节跳动宣布,其 AI 助手豆包的企业版用户数正式突破 500 万,成为国内用户规模最大的 AI 办公平台。豆包已深度集成到飞书、抖音、头条等字节系产品中。

豆包企业版提供了文档撰写、数据分析、会议纪要、智能客服等 20 多个场景的 AI 能力。数据显示,使用豆包的企业员工工作效率平均提升 35%,文档撰写时间缩短 60%。

来源:36氪

💼 微软 Copilot 全面接入 Office 365

微软宣布 Copilot 已全面接入 Office 365 全家桶,包括 Word、Excel、PowerPoint、Outlook、Teams。月活用户突破 2 亿,成为全球使用最广泛的 AI 办公助手。

新版 Copilot 可以跨应用协作:在 Teams 会议中自动生成纪要并同步到 Word,从 Excel 数据自动生成 PowerPoint 图表,根据邮件内容智能安排日程。微软 CEO 纳德拉表示,Copilot 已成为微软增长最快的业务。

来源:微软官方博客

🔬 AI最前沿

🧬 MIT 发布 DNA 大模型,预测基因功能准确率达 95%

MIT 研究团队发布了首个专门用于 DNA 序列分析的大模型 GenomeLM,在 30 亿个基因组数据上训练。GenomeLM 可以预测基因功能、识别致病突变、设计新的蛋白质序列。

在测试中,GenomeLM 成功预测了 95% 的基因功能,并发现了 200 多个此前未知的致病基因。研究团队表示,这将大幅加速新药研发和精准医疗的发展。

来源:Nature 期刊

🤖 斯坦福发布具身智能基准测试 RoboEval

斯坦福大学发布了首个标准化的具身智能基准测试 RoboEval,包含 1000 个真实世界任务,涵盖导航、抓取、组装、清洁等场景。

测试结果显示,当前最强的机器人模型在 RoboEval 上的成功率仅为 42%,远低于人类的 98%。研究团队指出,具身智能仍处于早期阶段,需要更多的数据和算法突破。

来源:斯坦福 AI Lab

🧠 清华团队实现脑机接口实时翻译思维

清华大学脑与智能实验室团队成功实现了 思维实时翻译:通过非侵入式脑机接口采集脑电信号,结合大模型解码,可以将用户的思维直接转换为文字,准确率达到 78%。

这项技术有望帮助渐冻症等失语患者重新获得交流能力。研究团队表示,未来将进一步提升准确率,并探索思维控制设备的应用。

来源:清华大学新闻网

💰 投融资动态

公司金额轮次投资方
Perplexity$8亿D轮软银、NVIDIA
月之暗面¥50亿C轮阿里、红杉中国
MiniMax¥40亿C轮腾讯、高瓴资本
Figure AI$6.5亿B轮微软、OpenAI
智谱AI¥35亿C轮美团、小米

数据来源:36氪、TechCrunch

💡 富贵点评

今天的 AI 圈可以用四个字概括:百花齐放。

OpenAI 的 GPT-5 Turbo 主打性价比,Anthropic 的 Claude 瞄准医疗等专业领域,DeepSeek 用开源策略抢占开发者心智,Meta 的 Llama 4 在长文本处理上一骑绝尘。各家都在找自己的差异化定位,这对用户来说是好事。

几个值得关注的趋势:

  1. 推理成本持续下降 — GPT-5 Turbo 降价 60%,意味着 AI 应用的商业化门槛进一步降低。预计今年会看到更多 AI 原生应用爆发。
  2. 垂直领域深耕 — Claude 通过医学考试不是噱头,而是 AI 在专业领域落地的信号。金融、法律、教育等行业都会迎来 AI 变革。
  3. 开源 vs 闭源的竞争白热化 — DeepSeek-V3 和 Llama 4 的开源,给闭源模型带来巨大压力。开源模型的性能已经接近甚至超越闭源,这会倒逼 OpenAI 等公司加速创新。
  4. 多模态成为标配 — Gemini 2.0 的实时视频理解、Llama 4 的多模态支持,说明单纯的文本模型已经不够了。未来的 AI 助手必须能看、能听、能理解真实世界。
  5. 中国 AI 崛起 — 字节、阿里、腾讯在应用层的布局已经领先全球,DeepSeek、月之暗面等创业公司在技术上也不输国际巨头。中国 AI 正在从跟随者变成引领者。

给开发者的建议:

  • 现在是入局 AI 应用开发的最佳时机,成本低、工具全、市场大
  • 不要只盯着通用 AI,垂直领域有更多机会
  • 学会使用开源模型,降低对单一厂商的依赖
  • 关注 Agent 和多模态技术,这是下一个爆发点

— 王富贵

📋 要点回顾

  • ✅ OpenAI GPT-5 Turbo 发布,推理速度提升 3 倍,价格降低 60%
  • ✅ Claude 3.5 Opus 通过医学执业资格考试,准确率 92%
  • ✅ DeepSeek-V3 开源,万亿参数 MoE 架构,单机 8 卡可运行
  • ✅ 英伟达 B200 开始量产,AI 算力提升 5 倍
  • ✅ Gemini 2.0 支持实时视频理解,集成 AR 眼镜
  • ✅ Meta Llama 4 上下文窗口扩展至 200 万 tokens
  • ✅ 字节豆包企业版用户破 500 万,微软 Copilot 月活破 2 亿
  • ✅ MIT 发布 DNA 大模型,基因功能预测准确率 95%
  • ✅ 清华实现脑机接口实时翻译思维,准确率 78%
  • ✅ AI 投融资持续火热,月之暗面融资 50 亿人民币

📰 富贵早报 · 每日 8:00 更新 · 关注 AI 行业最新动态
💬 有想法?欢迎留言讨论