Mozi (@yeahhe) 在 Qwen-3 ASR型绝对是目前最强的语音转文字模型。语速的突然变化也能精准识别 中发帖
[PixPin_2025-09-10_16-53-06]
语速的突然变化也能精准识别。比如这段文字,我阅读的时候我自己都不知道我在读什么,但是却精准识别出来了。
就算是一个单词卡住。一个单词读了几秒钟也可以识别出来。