flynn (@flyhunterl) 在 飞速Markdown 知识库插件上线!特别做了召回优化!争取做出一个高质量的知识库! 中发帖
flymd 上线快两个月咯 最开始是没打算做Rag的 但是我自己又是Rag的高频率使用者,在Blinko和openwebui里都高频率使用Rag。所以就想着给flymd也做一个知识库功能。
最开始不打算做Rag 主要是考虑到隐私和质量问题。但是隐私和便捷确实属于鱼和熊掌。在和朋友讨论后我针对flymd的知识库做了以下设置
隐私问题
提供了 白名单和黑名单设置,黑名单优先。限制向量模型的索引范围 我主要用来向量一些摘抄,所以我只用了白名单。 白名单外的目录 向量模型没有索引权限。索引的二进制文件只保存在本地。最大限度的保证了隐私问题
质量问题
知识库的召回质量非常重要,我个人使用过很多知识库应用,这点深有体会。所以这方面是我着重打磨的地方,花了我整整一天时间。
读写速度
在索引创建和速度上,我是用json来储存元数据,然本本地使用f32二进制保存索引内容。这样做的最大好处是体积小,...