LINUX DO Channel

慕鸢 (@user792) 在 AI red teamer （人工智能红队）系列22 – 人工智能基础 – 扩散模型中发帖

AI red teamer （人工智能红队）系列22 – 人工智能基础 – 扩散模型
扩散模型是一种生成模型，因其生成高质量图像的能力而引人关注。与生成对抗网络（GANs）和变分自编码器（VAEs）等传统生成模型不同，扩散模型通过添加和去除噪声的步骤来学习数据分布。事实证明，这种方法能有效生成逼真的图像、音频和其他类型的数据。 
扩散模型的工作原理
扩散模型的功能是在输入图像中逐渐添加噪音，然后学习逆向生成新图像。然而，当根据文字提示生成图像时，如 “a cat in a hat”，还需要额外的步骤将文字纳入生成过程。 
要根据文本提示生成图像，扩散模型通常会集成一个文本编码器，如 Transformer 或 CLIP 将文本转换为抽象表示。然后，该抽象表示将为去噪过程提供条件，确保生成的图像与提示一致。 

文本编码： 第一步是使用预先训练好的文本编码器对文本提示进行编码。例如，提示语 ...