mrgx 在 GPT Image2 测评 中发帖
简单测了下 GPT 的图像生成,放几组图大家看看
这两天顺手拿 GPT 跑了几组图,想看看它现在的图像生成大概是什么水平。
没有搞特别严谨的量化,就是按几个比较常见、也比较容易翻车的方向随便测了一下:
复杂场景
人像细节
风格混合
文字排版
主要看三点:
能不能理解提示词
细节和观感怎么样
有没有明显翻车
1. 夜景复杂场景
提示词:
一个下雨的东京街头夜景,霓虹灯反射在湿润的柏油路面上,街边有拉面店、便利店和行人撑着透明雨伞,远处有电车驶过,画面采用电影级光影效果,超写实风格,8K分辨率,浅景深,镜头焦距50mm,细节丰富
生成结果:
[image]
2. 人像细节
提示词:
一位中年女性科学家坐在实验室中,穿着白大褂,桌上摆满试管和显微镜,脸部细节真实自然,有细微皱纹和皮肤纹理,光线从侧面窗户照进来形成柔和阴影,超写实摄影风格,背景略虚化,高动态范围 ...