Mozi (@yeahhe)Gemini 3 模型ASR音频转文字对比 2.5 Pro 大幅提升,而且还能听懂背景音乐的粤语 中发帖

Gemini 3 Pro
第一次发现把背景音乐也提取出来了
[image]
[image]
[明星的僵尸公寓_msg_2]
Gemini 2.5 Pro
[image]
[告别僵尸片辉煌_msg_2]


所以,默认ASR模型改为Gemini 3,加入提示词
[image]
[image]
[image]