@HIllya51 在 [开源]直接调用Win11实时字幕的语音识别模型,从而可以在Win10上使用Windows语音识别 中发帖
众所周知Win11有一个实时字幕(LiveCaptions)的功能能进行语音识别,非常好用并且也围绕它诞生了一些翻译项目。但这个只能在Win11上运行,且Windows没提供API,所以即使想翻译也只能通过在后台运行LiveCaptions来间接获取文字,效率低下且不灵活。
现在可以通过这个项目不使用LiveCaptions而是直接运行其模型,从而可以提高效率且可以在Win10上运行。为了简单起见,现在程序可以自动将文字输出到剪贴板,从而使得任意支持读取剪贴板的翻译软件都可以无痛接入语音识别。
程序可以识别系统已安装的语言包。但对于在Win10上运行时,由于无法在系统里安装语言包,可以自己寻找语言包,然后直接将包复制到根目录里,就可以直接识别到,绿色无污染。如果不知道怎么去寻找语言包,我打包了一个包含中日文的包,可以直接试一下。Microsoft OneDrive
模型理论上在W...