article / WayDigital / Product Notes
端侧语音转文字模型怎么选:FunASR、Whisper、Vosk、小米 MiMo 和一堆开源 ASR 的真实对比
把语音转文字塞进手机里,真正要看的不是跑分,是包体、流式和发热 昨晚我重新把这一批开源 ASR 项目翻了一遍。FunASR 很热,小米 MiMo 也出来了,MiniMind / MiniCPM-o 这种语音多模态项目也容易让人心动。可如果目标是做一个普通用户能下载、低端安卓机也不至于崩的离线功能,筛选标准一下子就变得很朴素:模型别太大,最好能流式,语言够用,运行时别把 App 拖死。 我这次按端侧产品的口径查了一轮:官方仓库、Mode...