@Tairitsu 在 Gemini 3似乎在ASR(音频转字幕)方面反而退步了,佬友们有什么好的替代吗 中发帖
gemini app/web上的是最离谱的,上传的.m4a音频(14分钟),来自这个视频,3.0pro能做到一点都没获取到,给我编了1分钟的字幕……
flash可以转录3分钟,但怎么调也做不到完全转录
aistudio上3.0pro生成同样有缺失,以及时间轴完全是错的
[屏幕截图 2025-11-19 023538]
这个是之前gemini2.5pro(aistudio)生成的正确部分
[屏幕截图 2025-11-19 023526]
结果因为76和79(这里的36)开头相似,3.0pro(aistudio)就错误的把两句当一句,把77和78两段直接忽略了(以及明显能看出时间错了)
目前刚试的2.5pro也还是可以正确的:
[屏幕截图 2025-11-19 024624]
不知道佬友们对此有什么招吗(
之前试过gpt grok claude都是不支持的,qwen...