三卷儿 (@sanjuaner)非技术人员萌新学习RAG,结合claudecode用,佬们指导一下啊~~ 中发帖

第一章:事情的起因 
我电脑内存不够了,清文件清到了平时没啥用又舍不得扔的PPT、视频等各种资料,再加上平时使用cc很需要他去查我的资料,而cc自带本地查找又消耗token又查不到点子上,于是乎…
我打算分3步:
1、学原理自己输出总结
2、体验这方面通用性强的工具
3、自己造一个适合自己的解决方案

第二章:超高强度学两天的总结-纯手敲闭卷考
【整体理解】
向量化重构了信息/知识/数据的查找方式,然后是RAG架构以及agent外接知识作为记忆等应用。
【自己理解知识网络】
核心就是存和取,在这之外的都属于应用层的
1、存数据:数据格式转换、向量模型/向量库选择(本地基本可跑)、切片策略(分隔符/父子/语义等)、元数据结构(类似给切片打标签)
2、取数据:元数据过滤、混合检索多路召回(关键词+向量)、融合排序算法+重排序模型
3、应用设计:知识库集合按业务拆、元数据...