ArkaneFans 在 [慢讯]字节竟然开源了？ Lance多模态大模型开源，支持图像视频输入和生成！中发帖最近抱抱脸上看到字节开源了个Any-to-Any模型（字节好久没开源过东西了吧），支持图像视频输入理解和生成 [image] [image] [image] 看仓库有几天了，我暂且定为慢讯，目前来看这个模型是好几个开源模型拼一块的（拼好模是吧） [image] 不过看起来是真心动，如果再加个音频输入和生成，能克隆音色，那我愿称之为真正的多模态模型

ArkaneFans 在 [慢讯]字节竟然开源了？ Lance多模态大模型开源，支持图像视频输入和生成！中发帖

最近抱抱脸上看到字节开源了个Any-to-Any模型（字节好久没开源过东西了吧），支持图像视频输入理解和生成 
 [image] 
[image] 
[image] 
看仓库有几天了，我暂且定为慢讯，目前来看这个模型是好几个开源模型拼一块的（拼好模是吧） 
 [image] 
不过看起来是真心动，如果再加个音频输入和生成，能克隆音色，那我愿称之为真正的多模态模型