leia (@wuyingnanleia) 在 管家级教程:在 Windows 上配置 WSL2 CUDA及 VLLM的开源音频克隆项目 中发帖
ok,那么今天给大家分享一下之前看到过的一个 音频克隆项目
[图片]
使用体验音色效果没有那么高的效果,不过开源嘛,搞来玩一玩试看看。
源地址: GitHub - index-tts/index-tts: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
关于IndexTTS
IndexTTS是一个基于 GPT 风格的文本转语音 (TTS) 模型,主要基于 XTTS 和 Tortoise 算法。
它能够通过拼音纠正汉字发音,并通过标点符号控制任意位置的停顿。
我们增强了系统的多个模块,包括改进说话人条件特征表示,并集成 BigVGAN2 以优化音频质量。我们的系统基于数万小时的数据进行训练,达到了最佳性能,超越了目前流行的 TTS 系统,例如 XTTS、CosyVoi...