@617自己撸了一个本地知识库 中发帖

做了什么
自己用AI 撸了一个本地知识库,大体设计流程如下。绝大部分都是AI 完成的,但是中间出现了很多的工程问题。
Markdown 文档


文档解析 & 分块 (document_loader.py)


OpenAI Embedding (text-embedding-3-small)


Milvus 向量存储 (本地 Docker)

─────┼───── 用户查询
│ │
▼ ▼
向量检索 ← 问题向量化


GPT-4o-mini 生成答案 (RAG)


FastAPI + SSE 流式返回


浏览器网页界面
过程
中间也尝试了bisheng,但是自由度太低了,最后就自己写了一个。如果大家喜欢,代码也已经在github 上了,不知道是否违规,就没...