Cohere 发布 Tiny Aya 开源多语言模型:33 亿参数支持 70+ 语言,笔记本电脑即可离线运行

📌 一句话总结:Cohere 在印度 AI 峰会期间发布 Tiny Aya 开源多语言模型家族,仅 33.5 亿参数即支持 70 多种语言,可在笔记本电脑上离线运行,用 64 块 H100 GPU 训练完成,为全球数十亿非英语用户打开了本地化 AI 的大门。

2026年2月17日 · 资讯分享 · 阅读时间约 4 分钟

Tiny Aya 是什么

2 月 17 日,企业级 AI 公司 Cohere 旗下研究部门 Cohere Labs 在印度 AI 影响力峰会期间正式发布了 Tiny Aya 模型家族。这是一组开源权重(open-weight)的多语言大语言模型,基础版本仅有 33.5 亿参数,却能支持超过 70 种语言,并且可以在普通笔记本电脑上离线运行——不需要联网,不需要云端 API。

整个家族包含多个版本:

模型名称 定位 覆盖语言区域
TinyAya(基础版) 通用多语言基座 70+ 语言
TinyAya-Global 指令微调版,更好地遵循用户指令 全球广泛覆盖
TinyAya-Fire 区域优化版 南亚语言(印地语、孟加拉语、泰米尔语等)
TinyAya-Earth 区域优化版 非洲语言
TinyAya-Water 区域优化版 亚太、西亚、欧洲

所有模型均已在 HuggingFace、Kaggle 和 Ollama 上开放下载,开发者可以直接部署到本地设备。

为什么值得关注

当前 AI 行业的主流叙事是「越大越好」——万亿参数、数万块 GPU、数十亿美元训练成本。但 Tiny Aya 走了一条完全相反的路:用尽可能小的模型,覆盖尽可能多的语言,跑在尽可能便宜的硬件上。

几个关键数字说明了这种「反共识」的力度:

  • 训练仅使用了 64 块 NVIDIA H100 GPU 的单个集群——相比动辄数万块 GPU 的大模型训练,这个规模小得惊人
  • 33.5 亿参数的体量意味着它可以在消费级硬件上流畅运行,不需要专业 GPU
  • 支持孟加拉语、印地语、旁遮普语、乌尔都语、古吉拉特语、泰米尔语、泰卢固语、马拉地语等南亚语言,以及大量非洲和亚太语言

Cohere 表示,区域化的模型变体能够「发展出更强的语言基础和文化细微差别,创建对目标社区来说更自然、更可靠的系统」。

离线能力的现实意义

在印度这样语言极度多样化的国家,互联网覆盖率仍然参差不齐。Tiny Aya 的离线运行能力意味着开发者可以构建不依赖网络连接的翻译工具、教育应用和本地化服务。这对农村地区、偏远社区以及网络基础设施薄弱的发展中国家尤为重要。

在语言多样性极高的国家,这种离线友好的能力可以在无需持续互联网接入的情况下,开启多样化的应用场景和用例。
— 来源:TechCrunch

Cohere 的商业背景

Tiny Aya 的发布时机耐人寻味。Cohere CEO Aidan Gomez 去年曾表示公司计划「很快」上市。据 CNBC 报道,Cohere 2025 年年化经常性收入(ARR)达到 2.4 亿美元,全年每季度环比增长 50%。在 IPO 前夕发布一个面向全球南方市场的开源模型,既是技术布局,也是市场卡位。

值得注意的是,Cohere 一直走企业级路线,与 OpenAI、Anthropic 的消费者导向形成差异化。Tiny Aya 进一步强化了这一定位:它不是要和 GPT 或 Claude 比谁更聪明,而是要解决「让 AI 说当地话」这个被大厂忽视的问题。

富贵点评

AI 行业有个很有意思的悖论:大家都在卷参数、卷算力、卷基准测试分数,但全球 70 多亿人里,大部分人的母语根本不是英语。一个万亿参数的模型如果只会说英语,对尼日利亚的约鲁巴语用户、印度的泰米尔语农民来说,跟不存在没什么区别。

Cohere 的 Tiny Aya 做了一件看起来不那么「性感」但极其务实的事:用 33 亿参数和 64 块 GPU,让 70 多种语言的使用者能在自己的笔记本上跑 AI。这不是技术突破,而是价值观选择——AI 的普惠不应该只是一句口号。当然,小模型的能力天花板摆在那里,但对于翻译、基础问答、本地化服务这些场景,够用就是最好的。

📋 要点回顾

  • 模型规模:基础版 33.5 亿参数,仅用 64 块 H100 GPU 训练,可在笔记本电脑上离线运行
  • 语言覆盖:支持 70+ 语言,包含南亚、非洲、亚太、欧洲等区域优化版本
  • 开源开放:开源权重,已上线 HuggingFace、Kaggle、Ollama,训练数据集和技术报告也将公开
  • 商业背景:Cohere ARR 达 2.4 亿美元,正筹备 IPO,Tiny Aya 是其全球南方市场战略的关键一步

❓ 常见问题

Q: Tiny Aya 支持中文吗?

A: Cohere 官方表示支持 70 多种语言,其中 TinyAya-Water 版本覆盖亚太地区语言。具体中文支持效果需要等技术报告发布后确认,但从覆盖范围来看大概率包含中文。

Q: 33 亿参数的小模型能做什么?

A: 适合翻译、基础问答、文本分类、本地化内容生成等任务。不适合复杂推理、长文写作或需要大量世界知识的场景。它的核心优势是多语言能力和离线部署,而非通用智能。

Q: 普通开发者怎么使用 Tiny Aya?

A: 最简单的方式是通过 Ollama 在本地一键部署,也可以从 HuggingFace 或 Kaggle 下载模型权重进行自定义开发。模型是开源权重,商业使用需遵循 Cohere 的许可协议。

作者:王富贵 | 发布时间:2026年2月17日

参考来源:TechCrunchTech Startups