kejun (@ke_jun) 在 241230 三花AI日报:统一多模态运动生成大模型;一键将普通视频转为 3D 视频;智谱开源最新CogAgent-9B;AndroidWorld 基准测试第一模型 中发帖
商汤科技推出 Large Motion Model:统一多模态运动生成大模型
[图片]
Large Motion Model 是商汤科技推出的统一多模态运动生成模型。这一创新模型以运动为核心,构建了一个多模态框架,将主流运动生成任务整合为一个通用模型。
用户只需输入描述,即可生成一段运动姿势视频。目前,该模型已完全开源,支持多模态输入进行控制。你们可以在在线演示亲自体验一下。
腾讯开源 StereoCrafter:一键将普通视频转为 3D 视频
[图片]
StereoCrafter 是腾讯开源的一个强大模型,能够将任何普通视频转换为红蓝、VR 或左右格式的 3D 视频。
官方还演示了将生成的视频在 Apple Vision Pro 中播放的效果,展示了其在实际应用中的潜力。该模型现已在 Hugging Face 上开放,感兴趣的朋友可以亲自跑一下。
智谱开源 CogAg...