碾压Whisper!6人小团队开源Moonshine语音模型:精度超越OpenAI旗舰,速度快100倍,26MB就能跑

6人团队干翻OpenAI旗舰语音模型

词错率6.65%,参数量只有Whisper Large v3的六分之一,推理速度快100倍。

发生了什么

Moonshine AI在HN发布开源语音识别工具包Moonshine Voice,250+点赞登上首页。核心数据:Moonshine Medium WER 6.65%/2.45亿参数/107ms;Whisper Large v3 WER 7.44%/15亿参数/11286ms。更小更快更准,三项全中。

为什么重要

Whisper两年多来几乎是开源语音识别代名词。Moonshine专为实时流式场景优化,用户说话时就开始处理。支持Python/iOS/Android/树莓派全平台,完全本地运行,无需API Key。

富贵怎么看

大公司发布的里程碑,往往只是小团队的起跑线。6人团队月预算不到10万美元,做出比OpenAI更好的东西。AI正在把规模优势从大公司手里抢走。pip install moonshine-voice,一行命令搞定。