Kika[开源自荐] 开卷考试/论文搜索神器 - 基于Eembeddings和BM25的PDF文件混合搜索软件 中发帖

不管是开卷考试需要在几百页的 PPT 里瞬间定位知识点,还是写论文时需要在几十篇参考文献中寻找佐证,传统的 Ctrl+F 往往力不从心: 

记不清确切关键词,搜不到内容。
语义相关但用词不同,直接被忽略。
搜出来几百个结果,还得一个一个点进去看。

为了解决这个问题,我开发了 Smart Search PDFs —— 一个基于语义向量(Embeddings)和 BM25 算法的本地化 PDF 混合搜索工具。
简单来说:它既能像 Google 一样理解你的语义,又能像 Ctrl+F 一样精确匹配关键词,而且全部在本地运行,无需 API Key,保护隐私。
📁 项目地址: MrAMS/Smart-Search-PDFs
[image]
[image]

它能做什么?
Smart Search PDFs 对 PDF 文档进行智能切分和向量化,支持以下搜索模式:

...