@stevessr 在 PersonaPlex:全双工会话语音模型的语音与角色控制『转』| NVIDIA 中发帖
[!quote]+
PersonaPlex 是一种实时、全双工语音转语音对话模型,通过文本角色提示和音频语音条件控制实现角色控制。它训练于合成与真实对话的结合,产生自然、低延迟的口语互动,并保持一致的人物形象。PersonaPlex 基于 Moshi 架构和权重。
[image]