kejun (@ke_jun)24914三花AI快讯:腾讯开放世界游戏的视频模型;无需穿戴设备的全身动捕;PuLID 现已支持 FLUX;下一代 OCR 模型;桌面AIAgent 测试平台;半身数字人;扩散反转图像编辑工具 中发帖

三花 AI 一觉醒来发生了什么?欢迎阅读 👇 
:man_office_worker:t2: HeyGen: 半身数字人 Avatar 3.0
🖼 Out of Focus:基于扩散反转的图像编辑工具
🤪 PuLID 现已支持 FLUX
🤸‍♀️ GVHMR:无需穿戴设备的全身动捕
🔠GOT-OCR2_0:下一代 OCR 模型
🎮 腾讯 GameGen-O:首个专用于生成开放世界游戏的视频模型
🖥 微软 WAA:测试 AI Agent 在 PC 上的表现

HeyGen: 半身数字人 Avatar 3.0

HeyGen 发布 Avatar 3.0 主要改进了脚本理解能力、面部表情和语音语调,还新增了唱歌能力。
Out of Focus:基于扩散反转的图像编辑工具
[图片]
Out of Focus v1.0 允许用户通过提示词修改图像,核心技术是扩散模型的反转过程。
...