亘古轮回Colby (@WswjzColby)给大家介绍一个低配还高精度的日语语音识别(ASR)模型,以及我开发的配套的软件 中发帖

就是ReazonSpeech。这个模型效果非常优秀,识别精度高不错字,时间戳还不漂移。能纯cpu使用,我的渣机gtx1650 laptop上vad都带不起来whisper 😅 ,但是用这个模型就非常轻松。 
不过这个模型附带的程序只是个示例,根本没法用,所以我开发了配套用的软件,加上了vad,支持输出srt、vtt、ass等多种格式,还可以开启openai兼容api服务。https://github.com/wjz2001/ReazonSpeech
如果喜欢的话欢迎点个star或者分享给有需求的人