欣欣|林可欣 (@StellaFortuna)qwen3.5o-p音频文件识别好不错!比豆包还强一些 中发帖

[Screenshot_20260331_015358] 
2分半非常嘈杂的录音,因为我的眼镜才200块钱 主要花费在概念和镜片上了(近视镜)
粗略看了一下,只有两处需要修改 整体也不影响阅读
比豆包的更稳定,精准!
不过豆包在我的使用中一直以来强的还是图片OCR
音频方面可能语音输入和音频识别不是一个模型
另外千问的识别速度也更快一些w
有时间再测测视觉识别(Ocr)