过期绿坝粮 (@arch_linux)一个搜索引擎的开源实现 中发帖

sese-engine | 开源搜索引擎
数据即未来,我们的未来要掌握在自己手中


这是一个搜索引擎的全套开源实现,说实话,它很老了,但不可否认的是确实很有趣且配置要求不高
在曾经一段时间内曾经将这个引擎作为主力使用过,不过作为一个算法尚未调优的开源项目面对专注seo的山寨网站仍然力不从心,每次搜索都得叠很长一串buff,况且现在已经25年了容,此类引擎的排序算法或多或少受到了影响
你有兴趣自己实现搜索引擎或者研究爬虫算法那当然最好,某种意义上可以算作LLM爬虫的开源实现(?)

而且自己有一个搜索引擎超酷的!



开源仓库



引擎主页