欣欣|林可欣 (@StellaFortuna) 在 qwen3.5o-p音频文件识别好不错!比豆包还强一些中发帖[Screenshot_20260331_015358] 2分半非常嘈杂的录音，因为我的眼镜才200块钱主要花费在概念和镜片上了(近视镜) 粗略看了一下，只有两处需要修改整体也不影响阅读比豆包的更稳定，精准! 不过豆包在我的使用中一直以来强的还是图片OCR 音频方面可能语音输入和音频识别不是一个模型另外千问的识别速度也更快一些w 有时间再测测视觉识别(Ocr)

欣欣|林可欣 (@StellaFortuna) 在 qwen3.5o-p音频文件识别好不错!比豆包还强一些中发帖

[Screenshot_20260331_015358] 
2分半非常嘈杂的录音，因为我的眼镜才200块钱 主要花费在概念和镜片上了(近视镜) 
粗略看了一下，只有两处需要修改 整体也不影响阅读 
比豆包的更稳定，精准! 
不过豆包在我的使用中一直以来强的还是图片OCR 
音频方面可能语音输入和音频识别不是一个模型 
另外千问的识别速度也更快一些w 
有时间再测测视觉识别(Ocr)