📌 一句话总结:智谱发布参数量翻倍的旗舰模型 GLM-5 对标 Claude Opus,春节前中国 AI 大模型厂商集体「抢跑」,行业预计 DeepSeek 将在假期期间放出下一代架构。
2026年2月11日 · 资讯分享 · 阅读时间约 4 分钟
GLM-5:参数翻倍,剑指 Claude Opus
2 月 11 日,北京 AI 公司智谱(Knowledge Atlas,港交所:2513)宣布将于 2 月 12 日正式发布旗舰大语言模型 GLM-5。据智谱声明,GLM-5 的参数量较前代翻倍以上,专为复杂编程和 Agent(智能体)任务设计,并已直接与 Anthropic 的 Claude Opus 系列进行了性能对标。
有趣的是,GLM-5 并非「突然出现」。据 The Information 报道,几天前在 OpenRouter 上悄然上线的开源模型「Pony Alpha」,实际上就是 GLM-5 的「马甲」——智谱选择先以匿名方式让开发者社区自行评测,再正式揭晓身份。这种「先放模型再揭牌」的策略,在 AI 圈并不罕见,但智谱的执行颇为大胆。
「DeepSeek 是一记警钟。」
— 智谱联合创始人、首席 AI 科学家唐杰,在 IPO 后的内部信中写道,强调公司必须回归基础研究
全球首家上市大模型公司,股价一周暴涨 50%
智谱是全球首家在股票市场上市的主要大模型公司,于 2026 年初登陆港交所,目前估值约 180 亿美元。公司 2019 年由清华大学研究团队创立,早期获得阿里巴巴和腾讯投资。
本周,在摩根大通首次覆盖研报和 GLM-5 悄然上线的双重催化下,智谱股价已暴涨超过 50%。市场对 AI 新模型发布的敏感度正处于历史高位——本月以来,从法律合规软件到电子游戏,各行各业都因 AI 新品发布而遭遇股价冲击。
智谱正在从面向中国企业客户的定制 AI 解决方案,转型为面向全球用户的 AI 服务商。公司已推出 GLM Coding Plan 订阅服务,类似于 Anthropic 的 Claude Code(后者在中国不可用)。
春节前的「抢跑大战」:谁在发模型?
GLM-5 的发布并非孤立事件。春节前夕,中国 AI 大模型赛道正在上演一场密集的「抢跑大战」:
| 公司 | 动态 | 亮点 |
|---|---|---|
| 智谱 | GLM-5 正式发布 | 参数翻倍,对标 Claude Opus |
| 月之暗面(Moonshot AI) | 上月发布最新 LLM | 开源性能榜单登顶 |
| 字节跳动 | Seedance 2.0 视频模型 | 广受好评,演示视频刷屏 |
| DeepSeek | 预计春节期间发布 | 下一代架构,或成新基准 |
行业普遍预计,DeepSeek 将在春节假期期间发布其下一代架构,届时可能为中国开源模型设立新的性能基准。这也解释了为什么各家都在抢在 DeepSeek 之前发布——一旦 DeepSeek 新模型落地,注意力将被迅速吸走。
华为芯片训练突破:打破美国芯片封锁
值得一提的是,智谱近期还宣布了另一项重要成就:成为首家完全使用华为昇腾(Ascend)芯片训练主要 AI 模型的中国公司。其 GLM-Image 图像生成模型完全在华为昇腾 Atlas 800T A2 服务器上训练完成,使用华为自研的昇腾 AI 处理器和 MindSpore 机器学习框架,未使用任何美国半导体技术。
这一成就尤为引人注目,因为 DeepSeek 此前在华为硬件上训练模型时遇到了广为人知的困难。智谱的成功证明,完全使用国产芯片进行大规模 AI 训练在技术上是可行的——尽管华为昇腾 910C 的 FP16 算力约为英伟达 H100 的 80%,但通过架构优化可以弥补硬件差距。
富贵点评
智谱这波操作很有意思。先用「Pony Alpha」的马甲在 OpenRouter 上让社区盲测,等口碑发酵了再揭牌——这比直接发布高调得多,也聪明得多。如果模型不行,马甲一脱没人知道;模型行的话,揭牌那一刻就是最好的营销。
但更值得关注的是春节前这场「抢跑大战」的逻辑。所有人都在赶在 DeepSeek 之前发布,因为 DeepSeek 每次出手都会重新定义「够用」的标准线。唐杰在内部信里说「DeepSeek 是一记警钟」,这话说得很实在。智谱的优势在于它是唯一上市的大模型公司,有资本市场的放大效应;劣势也很明显——上市意味着每个季度都要交成绩单,而 AI 研发的节奏不一定配合财报周期。至于华为芯片训练的突破,短期内更多是象征意义,但长期来看,如果中美科技脱钩持续加深,这条路线的战略价值会越来越大。
📋 要点回顾
- GLM-5 发布:参数量较前代翻倍,主攻编程和 Agent 任务,对标 Claude Opus,2 月 12 日正式上线
- 隐身测试:GLM-5 此前以「Pony Alpha」马甲在 OpenRouter 上悄然上线,先让社区盲测再揭牌
- 资本市场反应:智谱本周股价暴涨超 50%,受摩根大通首次覆盖和 GLM-5 上线双重催化
- 春节抢跑:月之暗面、字节跳动密集发布新模型,行业预计 DeepSeek 将在春节期间放出下一代架构
- 芯片突破:智谱成为首家完全使用华为昇腾芯片训练主要 AI 模型的中国公司
❓ 常见问题
Q: GLM-5 和 DeepSeek 的模型有什么区别?
A: GLM-5 主攻复杂编程和 Agent 任务,对标的是 Anthropic Claude Opus 系列。DeepSeek 则以开源和极致性价比著称,其激进的 API 定价策略曾压缩智谱的公有云利润空间。两者的技术路线和商业模式有明显差异——智谱更偏向企业级定制服务,DeepSeek 更偏向开源生态。
Q: 智谱为什么要用华为芯片训练模型?
A: 美国自 2022 年起限制向中国出口先进 AI 芯片(如英伟达 H100),中国 AI 公司需要寻找替代方案。智谱使用华为昇腾芯片完成训练,证明了国产芯片可以支撑大规模 AI 训练,这对中国 AI 产业的长期自主可控具有重要战略意义。
Q: 为什么中国 AI 公司都赶在春节前发布新模型?
A: 主要原因是 DeepSeek 预计将在春节期间发布下一代架构。DeepSeek 每次发布都会重新定义行业标准,各家希望在此之前抢占注意力和市场份额。此外,春节前也是中国科技行业传统的「年终冲刺」窗口期。
作者:王富贵 | 发布时间:2026年2月11日
参考来源:Business Times / Bloomberg · WinBuzzer · The Information