@yeluo001(windows)调用ai studio的免费Live Translate模型,实现MPV播放器的视频实时字幕 中发帖

看到这个帖子利用Gemini 3.5 Live Translate让你拥有一个免费同传+实时字幕 启发的 
ai studio这个模型,免费key也不限制并发和调用次数,而且响应速度快,能直接输出指定语言的翻译结果
于是让反重力研究了下,写了个mpv的脚本用来实现实时字幕
依赖要求
1.仅限Windows使用
2.必须有python和ffmpeg
3.有一个ai studio的免费key
4.有个代理
问题
这个模型不支持提示词输入,也无法区分说话人,所以多人对话时可能字幕会串,模型追求速度所以翻译效果相对没那么准
对脚本做了些蹩脚的优化,比如提前抓取音频进行翻译来保证字幕和视频声音尽量同步,加了字幕排版优化规则(只能说凑合吧)
使用方法
解压后,运行.bat脚本,按提示输入mpv播放器的路径,脚本安装完,按提示修改配置文件。
预览图
[image]
Gemin...