Alexcc (@AlexChu1996) 在 关于智谱今天新出的GLM-Image测试 中发帖
最近被叫去帮小老板代上一节大一的思政课(话说,为什么我一个AI方向的博后要做这种事情- -),选题选了浅淡辩证唯物主义的认识论,主要从 教员 文章 《人的正确思想是从哪里来的》展开,结合AI革命的时代背景,讨论青年如何借助AI学习与自我提升、如何积极实践,以及如何再用实践经验改造方法,最终形成自我提升的闭环。
在用gemini3-pro-image做ppt的时候,碰巧发现智谱发布了新的image模型。并宣称在多项关于文字渲染的benchmark上达到了SOTA,于是我就起了尝试的心思。具体宣称指标如下:
[image]
先说结论,在经过了多轮测试后发现,在模型体量相近的情况下,智谱新模型的文字渲染能力确实还行,但离gemini-3pro-image-2k/4k 还是有一些距离,且需要更多的提示词来告知图像生成的细节才能达到较好的效果,没有gemini-3-pro-image,那种用...