智谱 GLM-5 正式发布：参数量翻倍对标 Claude Opus，春节前中国 AI 大模型上演「抢跑大战」

📌 一句话总结：智谱发布参数量翻倍的旗舰模型 GLM-5 对标 Claude Opus，春节前中国 AI 大模型厂商集体「抢跑」，行业预计 DeepSeek 将在假期期间放出下一代架构。

2026年2月11日 · 资讯分享 · 阅读时间约 4 分钟

GLM-5：参数翻倍，剑指 Claude Opus

2 月 11 日，北京 AI 公司智谱（Knowledge Atlas，港交所：2513）宣布将于 2 月 12 日正式发布旗舰大语言模型 GLM-5。据智谱声明，GLM-5 的参数量较前代翻倍以上，专为复杂编程和 Agent（智能体）任务设计，并已直接与 Anthropic 的 Claude Opus 系列进行了性能对标。

有趣的是，GLM-5 并非「突然出现」。据 The Information 报道，几天前在 OpenRouter 上悄然上线的开源模型「Pony Alpha」，实际上就是 GLM-5 的「马甲」——智谱选择先以匿名方式让开发者社区自行评测，再正式揭晓身份。这种「先放模型再揭牌」的策略，在 AI 圈并不罕见，但智谱的执行颇为大胆。

「DeepSeek 是一记警钟。」
— 智谱联合创始人、首席 AI 科学家唐杰，在 IPO 后的内部信中写道，强调公司必须回归基础研究

全球首家上市大模型公司，股价一周暴涨 50%

智谱是全球首家在股票市场上市的主要大模型公司，于 2026 年初登陆港交所，目前估值约 180 亿美元。公司 2019 年由清华大学研究团队创立，早期获得阿里巴巴和腾讯投资。

本周，在摩根大通首次覆盖研报和 GLM-5 悄然上线的双重催化下，智谱股价已暴涨超过 50%。市场对 AI 新模型发布的敏感度正处于历史高位——本月以来，从法律合规软件到电子游戏，各行各业都因 AI 新品发布而遭遇股价冲击。

智谱正在从面向中国企业客户的定制 AI 解决方案，转型为面向全球用户的 AI 服务商。公司已推出 GLM Coding Plan 订阅服务，类似于 Anthropic 的 Claude Code（后者在中国不可用）。

春节前的「抢跑大战」：谁在发模型？

GLM-5 的发布并非孤立事件。春节前夕，中国 AI 大模型赛道正在上演一场密集的「抢跑大战」：

公司	动态	亮点
智谱	GLM-5 正式发布	参数翻倍，对标 Claude Opus
月之暗面（Moonshot AI）	上月发布最新 LLM	开源性能榜单登顶
字节跳动	Seedance 2.0 视频模型	广受好评，演示视频刷屏
DeepSeek	预计春节期间发布	下一代架构，或成新基准

行业普遍预计，DeepSeek 将在春节假期期间发布其下一代架构，届时可能为中国开源模型设立新的性能基准。这也解释了为什么各家都在抢在 DeepSeek 之前发布——一旦 DeepSeek 新模型落地，注意力将被迅速吸走。

华为芯片训练突破：打破美国芯片封锁

值得一提的是，智谱近期还宣布了另一项重要成就：成为首家完全使用华为昇腾（Ascend）芯片训练主要 AI 模型的中国公司。其 GLM-Image 图像生成模型完全在华为昇腾 Atlas 800T A2 服务器上训练完成，使用华为自研的昇腾 AI 处理器和 MindSpore 机器学习框架，未使用任何美国半导体技术。

这一成就尤为引人注目，因为 DeepSeek 此前在华为硬件上训练模型时遇到了广为人知的困难。智谱的成功证明，完全使用国产芯片进行大规模 AI 训练在技术上是可行的——尽管华为昇腾 910C 的 FP16 算力约为英伟达 H100 的 80%，但通过架构优化可以弥补硬件差距。

富贵点评

智谱这波操作很有意思。先用「Pony Alpha」的马甲在 OpenRouter 上让社区盲测，等口碑发酵了再揭牌——这比直接发布高调得多，也聪明得多。如果模型不行，马甲一脱没人知道；模型行的话，揭牌那一刻就是最好的营销。

但更值得关注的是春节前这场「抢跑大战」的逻辑。所有人都在赶在 DeepSeek 之前发布，因为 DeepSeek 每次出手都会重新定义「够用」的标准线。唐杰在内部信里说「DeepSeek 是一记警钟」，这话说得很实在。智谱的优势在于它是唯一上市的大模型公司，有资本市场的放大效应；劣势也很明显——上市意味着每个季度都要交成绩单，而 AI 研发的节奏不一定配合财报周期。至于华为芯片训练的突破，短期内更多是象征意义，但长期来看，如果中美科技脱钩持续加深，这条路线的战略价值会越来越大。

📋 要点回顾

GLM-5 发布：参数量较前代翻倍，主攻编程和 Agent 任务，对标 Claude Opus，2 月 12 日正式上线
隐身测试：GLM-5 此前以「Pony Alpha」马甲在 OpenRouter 上悄然上线，先让社区盲测再揭牌
资本市场反应：智谱本周股价暴涨超 50%，受摩根大通首次覆盖和 GLM-5 上线双重催化
春节抢跑：月之暗面、字节跳动密集发布新模型，行业预计 DeepSeek 将在春节期间放出下一代架构
芯片突破：智谱成为首家完全使用华为昇腾芯片训练主要 AI 模型的中国公司

❓ 常见问题

Q: GLM-5 和 DeepSeek 的模型有什么区别？

A: GLM-5 主攻复杂编程和 Agent 任务，对标的是 Anthropic Claude Opus 系列。DeepSeek 则以开源和极致性价比著称，其激进的 API 定价策略曾压缩智谱的公有云利润空间。两者的技术路线和商业模式有明显差异——智谱更偏向企业级定制服务，DeepSeek 更偏向开源生态。

Q: 智谱为什么要用华为芯片训练模型？

A: 美国自 2022 年起限制向中国出口先进 AI 芯片（如英伟达 H100），中国 AI 公司需要寻找替代方案。智谱使用华为昇腾芯片完成训练，证明了国产芯片可以支撑大规模 AI 训练，这对中国 AI 产业的长期自主可控具有重要战略意义。

Q: 为什么中国 AI 公司都赶在春节前发布新模型？

A: 主要原因是 DeepSeek 预计将在春节期间发布下一代架构。DeepSeek 每次发布都会重新定义行业标准，各家希望在此之前抢占注意力和市场份额。此外，春节前也是中国科技行业传统的「年终冲刺」窗口期。

作者：王富贵 | 发布时间：2026年2月11日

参考来源：Business Times / Bloomberg · WinBuzzer · The Information