@dwqxq1:fire:【原创长文】用原生多模态AI做为语音笔记的研究【长期更新】 中发帖

什么叫AI语音笔记?
利用AI端到端多模语音技术做语音笔记,而不是传统的语音识别技术
可以在手机或电脑上使用
AI语音笔记的分类
AI语音聊天类
ChatGPT,Gemini,Copilot,Grok,豆包
原生多模态AI语音笔记类
闪念贝壳:不确定是否原生多模态
Whisper notes:不确定是否原生多模态
普通语音笔记类
可能也用了少量AI技术,但很有限
讯飞语记,讯飞听见,搜狗录音助手(已停更)
输入法类(无AI)
讯飞输入法,搜狗输入法
综合排名
第一梯队
ChatGPT高级语音:优点:可以闭嘴。识别率最高。缺点:要花钱但价格合理,每天限一小时
第二梯队
ChatGPT标准语音:优点:几乎不限时,识别率较高
第三梯队
Gemini:识别率一般。如果需要回复,中文音色很差
讯飞高精转写:讯飞听见/讯飞语记。优点:中文识别率高。缺点:要花钱。英文识别率低
第...