Yoan Huang咱web端也能跑本地知识库,RAG(傲娇)-篇章1-核心技术方案 中发帖

不废话,直接干货,先上结论 
核心技术方案如下
transfomerjs + indexdb
知识库与RAG介绍
可能有些小伙伴对这两玩意不太清楚,大致介绍下
知识库(偏狭义上或特定领域下的知识库)
知识库我觉得算是一个赛道方向,现在有很多家如dify,openai等等,包括阿里等平台,都有提供这类功能服务,通过将用户文本向量化(将文本变成数字),存储到数据库中,最后在搜索时,可通过文本再向量化,达到语义化搜索(向量相似度计算),最后将相应匹配的文本交给AI回答.
这样做的好处就是,当你存储的文本如果是 “我想吃苹果”, 而你搜索的文本是"我吃苹果"或者"我超级tm的想吃苹果"时,是能够搜索到的.
RAG
而RAG,则是实现这样知识库的一个手段,如向量化,分片文本,文本预处理,巴拉巴拉的
划重点,圈起来,要考的地方
向量化,向量化,向量化
回归正题
向量化
通过transfo...