@stevessr 在 阿里现已开源 FunCineForge :一个生产大规模配音数据集的端到端数据集管道 中发帖
FunAudioLLM/Fun-CineForge · Hugging Face
Fun-CineForge 包含一个生产大规模配音数据集的端到端数据集管道,和一个基于多模态大模型的配音模型,该模型专为多样的电影场景而设计。利用该管道,我们构建了首个大规模中文电视剧配音数据集 CineDub-CN,该数据集包含丰富的标注和多样化的场景。在独白、旁白、对话和多说话人场景中,我们的配音模型在音频质量、唇形同步、音色转换和指令遵循等方面全部优于最先进的方法。