@stevessrWorldCompass : 长视界世界模型的强化学习 | 腾讯混元 中发帖

WorldCompass 采用群体相对策略优化(GRPO)理念,提升自回归视频生成中的动作跟随和视觉质量。