kejun (@ke_jun) 在 24926三花AI:ChatGPT 高级语音模式系统提示泄露;Meta Connect 2024 发布会总结; Llama 3.2:支持多模态;阿里 MIMO 视频换人 中发帖
三花 AI 一觉醒来发生了什么?欢迎阅读 👇
🖌 阿里 MIMO:AI 视频人物替换与动画生成
📣 Molmo:超越 GPT-4 的多模态视觉模型
🎬 OpenAI 的 ChatGPT 高级语音模式系统提示泄露
🌟 Meta Connect 2024 发布会总结
😃 Meta AI 发布 Llama 3.2:支持多模态,手机端运行无压力
阿里 MIMO:AI 视频人物替换与动画生成
AI 视频换脸技术我们已经见得多了,但阿里推出的 MIMO 直接允许用户对视频中的人物进行替换。它不仅支持根据骨骼动作生成动画,轻松实现 Animate Anyone 的功能,效果更佳,还具备视频背景融合功能。不过,暂时没有开源,从演示视频来看,将二次元角色替换到视频中的效果非常不错,当然,经不住仔细看脸部和细节,真人角色的替换则更显生硬和鬼畜。
Molmo:超越 GPT-4 的多模态视觉模型
...