无月 (@moonKa) 在 【知识分享】Embedding模型是什么?能做什么? 中发帖
新人第一次发帖,请多多包涵喵:)
embedding是什么?
embedding模型的本质,是把任意合法输入的信息 转换成 固定维度向量的一种工具。
如果你已经理解了万物皆向量这个观念,这一段会很好理解;就算没有听过,也不影响继续往下看。
我们所处的世界充满了各种形式的信息和数据,它们都可以用非常高维的方式来描述。以一段文字为例:“今天天气真不错!”,你可以从情感、语义、语法、风格、甚至语言等很多角度去刻画它,这些角度本身就构成了不同的判断维度。如果你把每个维度对应一个数值,一整组数值合在一起,就形成了一个高维向量。
假设我们做到了,找到一组高维向量[0.9111,0.6122,0.0012,...]完美的等价了"今天天气真不错!"这句话,那么我们再任意时刻,都可以像base64转码一样,将其等价转换,含义不变;但不同于base64的是,该高维向量每一个维度的值都代表着某种含义,因...