Menghan465 在 大佬们,我终于完成了大学第一个独自开发的项目,但还是有一点问题想请教 中发帖
我用了GPT-SOVITS模型Gradio的API来实现TTS功能和AI变声功能。
用基于Whisper.cpp的nodejs-Whisper实现了视频字幕生成和AI变声所需的STT功能,其实就是把要变声的音频的文本提取用于作为合成音频的文本。
然后存在一些问题:
1.第一次用基于Whisper.cpp的nodejs-Whisper还是可以直接使用的,用已有的audio文件中的音频库的话它所用的音频是以项目根目录下的audio文件夹的文件。但第二次用就会直接用node_modules\nodejs-whisper\cpp\whisper.cpp\audio里的,每次运行都会这样,只有第一次能用。
2.因为用的模型太多,我项目包含GPT-SOVITS和node_modules的话有20G,想打包成exe文件,但感觉不太现实,想知道可以怎样弄一个发行版的。