kejun (@ke_jun) 在 240109三花AI日报:微软开源 phi-4 模型;Adobe 发布透明视频生成;SAI 开源 SPAR3D 一秒生成3D模型;字节 S T A R 视频超分模型;Gazelle 多人注视检测在线版; 中发帖
字节跳动开源 S T A R 视频超分模型:利用 T2V 技术实现高清修复
[图片]
S T A R 是字节跳动开源的一个利用 T2V(Text-to-Video)模型对视频进行超分辨率的方法。无论是 AI 生成的视频还是现实中的视频,S T A R 都能进行高清修复。预训练模型(基于 I2VGen-XL 和 CogVideoX-5B)及推理代码现已发布,有兴趣的佬友可以自己试试。
Gazelle 多人注视检测技术在线版本发布,精准检测目光方向
[图片]
Gazelle 是一个开源的多人注视检测技术,能够精准地检测人们的目光方向和注视对象。
现在,Gazelle 的在线版本已经发布,社区提供了两个不同的演示:gaze-demo 和 Gaze-LLE-demo。
微软开源 phi-4 模型:14B 参数,性能超越 GPT-4o
[图片]
phi-4 是微软刚刚开源的最强...