欣 郁 (@user1164)【AI绘图】吹一下ideogram4 中发帖

这几天在研究ideogram4,我发现实在是一个不可多得的好模型! 
先说缺点:

系统开销大:以4070tis 16g+nvfp4量化为例,1M分辨率大概2-3s/t,4M分辨率大概17s/t,官方推荐的最高画质(4M分辨率+quality48步模式),大概12min一张图;以某云平台5090d 32g+fp8量化为例,官方推荐的最高画质(4M分辨率+quality48步模式)大概4.2min一张图;12g vram应该可以跑,但具体不清楚
提示词要求较高:几乎不支持自然语言prompt,需要自己设计或让LLM预先设计json格式的提示词,较为复杂

再说优点(特别是针对zimage家族)

微调可行性强:aitoolkit直接给了D0支持,lora训练适配好,实测人像训练很准——这一点比zimage base强太多了——建议用singularity训练器(参考B站教程)——我基本上...