@Jayden_Lee 在 做了个不接向量库的 RAG Skill,主打一个“有证据再说话” 中发帖
最近折腾了个小东西,叫 OpenRAG-Skill。
它不是那种一上来就 embedding、向量库、rerank 全家桶拉满的 RAG 项目,边界切得很死:只处理已经放进上下文里的内容,不碰站外检索,也不装作自己知道上下文外的东西。
思路其实很简单,就是把你贴进来的文档先整理成能引用的证据单元,再基于这些证据回答。每条关键结论都得能回到出处,证据不够就老老实实拒答,而不是硬编一个看起来像那么回事的答案。
比较适合这种场景:
制度、手册、合同、规范、FAQ 这类长文档问答
资料已经贴进对话里了
需要答案能引用、能复核、边界清楚
不想为了一个文档问答,先搭一套外部检索基础设施
我做这个东西,主要就是因为平时拿制度、手册、合同这类东西喂模型时,最烦的就是它“看了个大概就开始总结”,例外条款吞掉了,强制要求说成建议,资料没写的地方还敢自己补。
所以这个 skill 想解决的事很直接...