Tokenicrat 词元 (@talentedbug)【计数器教程】文生图模型写字的简易解决方案 中发帖

众所周知,让文生图模型写字(尤其是汉字)很困难。 
原因也很简单:模型并没有使用大量带有文字的图片训练,不善于将自然语言转换为图片。[1]后期修改难度太高,还容易破坏一致性。
前两天我灵光乍现,想出一个极度简单的解决方案:把需要写的字做成参考图。
举个例子
使用 Google 闪闪发光的 Nano Banana 模型。


没有参考图,提示词:
a glass can with plastic lid, black paint inside, wrapping paper writing "高级颜料"

[图片]
不出意外 Gemini 开始自己造字。


加上参考图:
[图片]
并且提示词修改为:
a glass can with plastic lid, black paint inside, wrapping paper writing "高级颜料" (as i...