@Arthur63Open WebUI + RAG 基础 中发帖

RAG 是什么

RAG 是 Retrieval Augmented Generation 的缩写,即检索增强生成。
使用 RAG 的目的是为模型提供更多的上下文,减少模型的幻觉,提高模型的注意力。

RAG 常见原理

RAG 的核心思想是为模型补充上下文,上下文的来源可以是文档,网页,图片…。最终所有的信息都会被喂给聊天模型(ChatGPT,Claude,Gemini…)。
现在常用的 RAG 工作流都依赖嵌入向量模型,流程大概是:

索引构建

收集整理要用的上下文文件(数据源),提交给嵌入向量模型(embedding),嵌入模型会返回数据的向量表示,客户端将向量数据保存到向量数据库中。

查询构建

客户端将用户提问也转换为向量数据,然后使用向量查询算法从向量数据库中检索相关的信息,提取相关度最高的信息块(可能有多块)。

模型问答

将以上提取到的信息块与用户的提问...