Duzc24 在 让我们用科普祛魅GPT 中发帖
[直观解释Transformer](【官方双语】GPT是什么?直观解释Transformer | 深度学习第5章_哔哩哔哩_bilibili),其中,Embedding和Temperatue的介绍很受启发 👍
自己的理解:Embedding部分介绍了向量(差)如何表征语义之间关系的相似性;Temperatue部分用直观的概率对比解释了为什么Temperatue参数越大gpt这类语言模型的创造力更强、同时也更可能没有逻辑。