@Duke486谷歌Gemini音视频实测,以后再也不需要字幕组了? 中发帖

图太多了,建议前往原文地址 duke486.com ,阅读效果图。 
谷歌最新发布的 Gemini 2.5 Pro 模型在音视频识别能力上带来了震撼表现,我对其进行了详细实测。这款模型号称拥有百万上下文,音视频理解能力尤其值得关注。本次测试旨在评估 Gemini 2.5 Pro 在处理音视频内容时的各项能力。
主要测试案例:

《你想活出怎样的人生》插曲: 要求AI输出画面内容、剧情、中日文字幕和音效。结果完美,各项要素均准确识别。
《你的名字》英文版片头曲: 要求输出画面内容、英文字幕、中文字幕和音效。表现优秀,仅英语歌词有少量小有少量小错误,但能理解剧情并补充相关信息。
初音未来《Miku》短视频: 要求输出画面内容和中日歌词。快速切换镜头时有少量遗漏,歌词和音乐节奏识乐节奏识别精准。
《New Game》第一集(仅音频): 重点测试! 只提供音频和作品名,要求输出中日字...