锦恢 (@LSTM-Kirigaya) 在 【完全开源】EW都能看懂的全新的 zero-shot 语音合成模型 index-tts 2.0 安装教程与深度体验 中发帖
前言
虽然锦恢经常写一些AI技术相关的文章,但是我其实有一个只有少部分人知道的身份,那就是我其实也是一个 steam 求生之路社区的 MOD 作者,下面是我的 steam 主页:
我在制作游戏语音包时一直有一个痛点,那就是客户每次让我制作一个新的游戏/动漫角色的语音包,我就得先去获取这个角色的语音样本,然后重新训练对应的权重部分。
而 index-tts 2.0 的推出帮我解决了这个问题,这是一个新的语音合成模型,输入角色 A 的几秒的语音样本和需要合成的文本,就能直接生成角色 A 音色的合成效果。
项目是完全开源的(代码,权重都开源,甚至 huggingface 和 modelscope 一式两份),下面是开源地址。
这篇文章,我会讲解如何安装和使用 index-tts,来用任意你想要的角色的音色来合成语音。
[图片]
安装和部署
先保证你的环境为:
pytho...