📌 一句话总结:阿里 Qwen-3.5 代码现身 GitHub,智谱 GLM-5 和 MiniMax M2.2 蓄势待发——中国 AI 公司在春节前掀起史上最密集的旗舰模型发布潮,与美国巨头正面交锋。
2026年2月10日 · 资讯分享 · 阅读时间约 4 分钟
一场春节前的「模型大战」
据南华早报报道,中国 AI 行业正在迎来一个「史诗级」的模型发布周。多家头部公司不约而同地选择在农历新年假期前密集发布旗舰模型,竞争激烈程度前所未有。
这波发布潮的背景是:2026 年开年以来,美国 AI 巨头 Anthropic 和 OpenAI 接连放出重磅产品,全球 AI 竞争骤然升温。中国公司显然不甘落后,选择在春节前集中「亮剑」。
Qwen-3.5:通义千问的下一代旗舰
最受关注的当属阿里巴巴云的 Qwen-3.5。本周日,阿里云模型开发团队的成员在 Hugging Face 和 GitHub 上提交了 Pull Request,正式曝光了下一代模型家族的信息。
根据已披露的初步信息,Qwen-3.5 系列将包含两个版本:
| 模型 | 参数量 | 亮点 |
|---|---|---|
| Qwen-3.5-9B | 90 亿 | 轻量级,适合端侧部署 |
| Qwen-3.5-35B | 350 亿 | 性能更强,企业级应用 |
两个关键升级值得注意:
首次原生多模态支持。这意味着 Qwen-3.5 将能够直接理解和处理文本、图像、音频等多种数据类型,而不再需要像之前那样依赖独立的视觉模型。
全新架构。两个模型都将采用阿里云的下一代架构,该架构最早在 2025 年 9 月通过实验性模型 Qwen3-Next 进行了预览。
Qwen-3 在 2025 年凭借出色的性能、宽松的开源许可和广泛的应用场景,成为全球最受欢迎的开源模型家族。Qwen-3.5 的到来,标志着阿里在开源 AI 领域的又一次重大押注。
— 来源:南华早报
GLM-5 和 M2.2:另外两个重量级选手
除了阿里,另外两家刚在港交所上市的 AI 公司也在紧锣密鼓地准备新模型。
智谱 AI(Z.ai)的 GLM-5是 GLM-4.7 的后续版本,据报道在创意写作、编程和逻辑推理三个方面都有显著提升。智谱 AI 于今年 1 月 8 日在港交所完成 IPO,GLM-5 的发布将是其上市后的首个重大产品动作。
MiniMax 的 M2.2则主打并行编程能力,这是一个相对独特的技术方向,可能在代码生成和多任务处理方面带来突破。
更大的图景:中国 AI 的「全面开花」
这波发布潮并非孤立事件。在此之前,中国 AI 行业已经经历了一轮密集的产品更新:
- 阿里巴巴发布了 Qwen3-Max-Thinking,这是其迄今最大、最强的模型
- 月之暗面(Moonshot AI)推出了 Kimi K2.5,号称最强开源权重模型,支持 100 个 Agent 协同
- 百度发布了文心 5.0(Ernie 5.0),以 2.4 万亿参数登顶中国 AI 模型排行榜
- 腾讯、百度、阿里正在投入数十亿元进行春节期间的 AI 聊天机器人广告推广
值得一提的是,DeepSeek 据报道只计划今年进行一次较小的更新——其下一个重大模型将是万亿参数级别的系统,但由于规模庞大,训练进度已经延迟。
此外,报道还提到了一个神秘的「隐形」竞争者,但具体身份尚未披露,为这场模型大战增添了更多悬念。
富贵点评
2025 年是中国开源 AI 崛起的一年,Qwen-3 成为全球最受欢迎的开源模型家族就是最好的证明。现在 Qwen-3.5 带着原生多模态能力来了,这说明中国 AI 公司已经不满足于「追赶」,而是在架构创新上开始走自己的路。
更有意思的是时间节点——春节前集中发布,既是对美国同行的回应,也是对国内市场的争夺。智谱和 MiniMax 刚上市就急着放大招,说明资本市场对 AI 公司的期待已经从「讲故事」转向了「拿产品说话」。
不过,参数量的军备竞赛正在让位于效率和实用性的比拼。Qwen-3.5 只推出 9B 和 35B 两个版本,没有追求千亿参数的「大力出奇迹」,反而更注重架构创新和多模态融合,这个思路值得关注。
📋 要点回顾
- Qwen-3.5 曝光:阿里在 GitHub 和 Hugging Face 提交 PR,包含 9B 和 35B 两个版本,首次原生支持多模态,采用全新架构
- GLM-5 即将发布:智谱 AI 上市后首个重大产品,在创意写作、编程和逻辑推理方面全面升级
- MiniMax M2.2:主打并行编程能力,走差异化路线
- 竞争背景:美国 Anthropic 和 OpenAI 开年放出重磅产品,中国公司选择春节前集中回应
- 行业趋势:从参数量竞赛转向架构创新和实用性比拼,开源生态持续壮大
❓ 常见问题
Q: Qwen-3.5 和 Qwen-3 相比有什么主要区别?
A: 最大的变化是首次原生支持多模态(文本、图像、音频),以及采用了全新的下一代架构(此前通过 Qwen3-Next 实验模型预览过)。目前已知有 9B 和 35B 两个版本。
Q: 这些模型什么时候正式发布?
A: 目前 Qwen-3.5 已在 GitHub 和 Hugging Face 提交了 Pull Request,正式发布预计在未来一到两周内。GLM-5 和 M2.2 也计划在 2 月 15 日农历新年前发布。
Q: Qwen-3.5 会开源吗?
A: 从在 Hugging Face 和 GitHub 提交 PR 的行为来看,Qwen-3.5 大概率会延续 Qwen-3 的开源策略。Qwen-3 正是凭借宽松的开源许可成为全球最受欢迎的开源模型家族。
Q: DeepSeek 为什么没有参与这波发布潮?
A: 据报道,DeepSeek 的下一个重大模型是万亿参数级别的系统,由于规模过于庞大,训练进度已经延迟。因此今年只计划进行一次较小的更新,而非旗舰级发布。