@617 在 自己撸了一个本地知识库 中发帖
做了什么
自己用AI 撸了一个本地知识库,大体设计流程如下。绝大部分都是AI 完成的,但是中间出现了很多的工程问题。
Markdown 文档
│
▼
文档解析 & 分块 (document_loader.py)
│
▼
OpenAI Embedding (text-embedding-3-small)
│
▼
Milvus 向量存储 (本地 Docker)
│
─────┼───── 用户查询
│ │
▼ ▼
向量检索 ← 问题向量化
│
▼
GPT-4o-mini 生成答案 (RAG)
│
▼
FastAPI + SSE 流式返回
│
▼
浏览器网页界面
过程
中间也尝试了bisheng,但是自由度太低了,最后就自己写了一个。如果大家喜欢,代码也已经在github 上了,不知道是否违规,就没...