@Chouannsoul 开发的 SoulX-Podcast 长篇播客模型 中发帖

SoulX-Podcast 专为播客风格的多轮、多说话人对话语音生成而设计,同时在传统的单声道 TTS 任务中也取得了卓越的性能。 
为了满足多轮口语对话更高的自然度要求,SoulX-Podcast 集成了多种副语言控制,并支持普通话和英语,以及四川话、河南话、粤语等多种中国方言,从而实现更具个性化的播客风格语音生成。





效果似乎还可以,有佬友关注嘛?