@Arthur63 在 Open WebUI + RAG 基础 中发帖
RAG 是什么
RAG 是 Retrieval Augmented Generation 的缩写,即检索增强生成。
使用 RAG 的目的是为模型提供更多的上下文,减少模型的幻觉,提高模型的注意力。
RAG 常见原理
RAG 的核心思想是为模型补充上下文,上下文的来源可以是文档,网页,图片…。最终所有的信息都会被喂给聊天模型(ChatGPT,Claude,Gemini…)。
现在常用的 RAG 工作流都依赖嵌入向量模型,流程大概是:
索引构建
收集整理要用的上下文文件(数据源),提交给嵌入向量模型(embedding),嵌入模型会返回数据的向量表示,客户端将向量数据保存到向量数据库中。
查询构建
客户端将用户提问也转换为向量数据,然后使用向量查询算法从向量数据库中检索相关的信息,提取相关度最高的信息块(可能有多块)。
模型问答
将以上提取到的信息块与用户的提问...