hoey (@cnnqjban521)RAG系统用向量匹配是不是感觉很鸡肋? 中发帖

在企业中,我们有很多数据库,比如订单、支付、退款…等等 ,想针对这些数据库 + LLM 做一个强化问答系统。 
常见的RAG系统通过向量相似度匹配解决了数据知识的检索。缺点就很明显

需要将传统关系型数据库数据导入到向量数据库,再经过清洗、标注、切片、向量等一些列操作繁琐
资源损耗,体量大一些的数据库,把历史全量数据都按照上面逻辑转到向量数据库,人、物资源都要很多。
用余弦相似度、欧几里得距离、点积等等的方式,通过所谓的相似度检索数据,本身就存在很大的不确定性和错误。

那我在想,为什么不能直接用代码逻辑直接查数据库呢?
下面举个例子,比如我要统计2025年1月 线上有机水果销售整体情况,他的流向图就是这样。
[image]