hoey (@cnnqjban521) 在 RAG系统用向量匹配是不是感觉很鸡肋？中发帖在企业中，我们有很多数据库，比如订单、支付、退款…等等，想针对这些数据库 + LLM 做一个强化问答系统

hoey (@cnnqjban521) 在 RAG系统用向量匹配是不是感觉很鸡肋？中发帖

在企业中，我们有很多数据库，比如订单、支付、退款…等等 ，想针对这些数据库 + LLM 做一个强化问答系统。 
常见的RAG系统通过向量相似度匹配解决了数据知识的检索。缺点就很明显 

需要将传统关系型数据库数据导入到向量数据库，再经过清洗、标注、切片、向量等一些列操作繁琐
资源损耗，体量大一些的数据库，把历史全量数据都按照上面逻辑转到向量数据库，人、物资源都要很多。
用余弦相似度、欧几里得距离、点积等等的方式，通过所谓的相似度检索数据，本身就存在很大的不确定性和错误。

那我在想，为什么不能直接用代码逻辑直接查数据库呢？ 
下面举个例子，比如我要统计2025年1月 线上有机水果销售整体情况，他的流向图就是这样。 
 [image]