@Zeelong.Zhao字节MegaTTS不需要npy文件也支持零样本自主克隆了,效果不错 中发帖

刚来L站没多久,这也是我发布的第一篇帖子,写得有点乱,大家多担待。关于megatts3官方五个月了没有开放vae的编码模型,megatts效果是不错,但是之前没办法自主克隆想要的音色,需要将音色发给官方生成npy文件才可以。 
但是,非常感谢@ACoderPassBy/MegaTTS-SFT 提供了vae的编码模型,日常使用甚至应用到项目中都完全没问题。
官方仓库地址:git clone GitHub - bytedance/MegaTTS3
模型下载:
modelscope download --model ACoderPassBy/MegaTTS-SFT --local_dir ./checkpoints
测试时顺带做了个包,供学习使用:
[image]
运行环境:
windows下常驻显存大约7个G,推理峰值占用显存在11G 因此至少需要12G显存的显卡。目前只支持...