@Arthur63 在 Open WebUI + RAG 基础中发帖RAG 是什么RAG 是 Retrieval Augmented Generation 的缩写，即检索增强生成

@Arthur63 在 Open WebUI + RAG 基础中发帖

RAG 是什么

RAG 是 Retrieval Augmented Generation 的缩写，即检索增强生成。 
使用 RAG 的目的是为模型提供更多的上下文，减少模型的幻觉，提高模型的注意力。 

RAG 常见原理

RAG 的核心思想是为模型补充上下文，上下文的来源可以是文档，网页，图片…。最终所有的信息都会被喂给聊天模型（ChatGPT，Claude，Gemini…）。 
现在常用的 RAG 工作流都依赖嵌入向量模型，流程大概是： 

索引构建

收集整理要用的上下文文件（数据源），提交给嵌入向量模型（embedding），嵌入模型会返回数据的向量表示，客户端将向量数据保存到向量数据库中。 

查询构建

客户端将用户提问也转换为向量数据，然后使用向量查询算法从向量数据库中检索相关的信息，提取相关度最高的信息块（可能有多块）。 

模型问答

将以上提取到的信息块与用户的提问...