StevenLi 在 求问目前最好用的语音输入法是什么,要能去掉磕绊、稍微智能一些 中发帖
我其实想要的是:大模型 语音转文字 的效果。
之前把录音mp3传给Gemini,转出来的文字效果很棒,能把我的磕绊、思考、嗯嗯啊啊什么的都去掉。往往转出来就是最终可用的版本了。
讯飞等产品,说完之后还要再精修,因为有很多嘴瓢的内容都被转录下来了。 🫠
大家有没有满足这样需求的语音输入法推荐呢?有多端最好,主要Win和Ios用。
或者大家觉得开发一个这样的输入法有没有说法。
整体思路挺简单的,就是录音+多模态大模型API,甚至还能指定大模型,有没有搞头 😇