6人团队干翻OpenAI旗舰语音模型
词错率6.65%,参数量只有Whisper Large v3的六分之一,推理速度快100倍。
发生了什么
Moonshine AI在HN发布开源语音识别工具包Moonshine Voice,250+点赞登上首页。核心数据:Moonshine Medium WER 6.65%/2.45亿参数/107ms;Whisper Large v3 WER 7.44%/15亿参数/11286ms。更小更快更准,三项全中。
为什么重要
Whisper两年多来几乎是开源语音识别代名词。Moonshine专为实时流式场景优化,用户说话时就开始处理。支持Python/iOS/Android/树莓派全平台,完全本地运行,无需API Key。
富贵怎么看
大公司发布的里程碑,往往只是小团队的起跑线。6人团队月预算不到10万美元,做出比OpenAI更好的东西。AI正在把规模优势从大公司手里抢走。pip install moonshine-voice,一行命令搞定。