kejun (@ke_jun)250305 三花AI日报:智谱开源原生中文输入的文生图模型; 硅基流动将于 2025 年 3 月 6 日下线未备案模型;微软 ART:多层透明图像生成技术;Anthropic 完成 35 亿美元融资 中发帖

智谱开源 CogView-4:支持原生中文输入的 6B 文生图模型
[图片]
智谱最近开源了 diffusers 版本的 CogView-4 文生图模型,该模型具有 6B 权重,支持原生中文输入,并且能够进行中文文字绘画。佬们可以在 Hugging Face 上在线体验试试。
智谱真是给力呀,才宣布融资,今天就开始开源了。
微软 ART 模型:多层透明图像生成技术
[图片]
ART 是微软推出的一款专注于生成多层透明图片的模型。与传统的生图模型只能生成一整张图片不同,ART 的独特之处在于它能够根据全局文本提示(global text prompt)和匿名区域布局(anonymous region layout),直接生成多个独立的透明图层(支持 RGBA 格式,即包含红、绿、蓝和透明度通道)。这些图层可以单独编辑、组合或叠加。
相比之前的多层图像生成技术(如 Text2...