用户已注销 (@NullUser)关于聊天记录处理用于大模型调用的新思路 中发帖

前情提要: 

很早之前就在考虑如何能让微信聊天记录在AI中应用起来,尝试过RAG、知识库等思路。
最近突然从自己做的语言特征提取的方案上找到了个思路。
我的思路:

对所有的聊天记录分段,然后搞一个或者多个本地json文件,每次读取一个分段的聊天记录,对聊天记录的内容进行提炼提取,生成两个json,一个按照事件存储,一个按照日期存储。往后每个分段读取提炼的时候,就一起读取事件储存和日期储存的两个json,进一步优化完善json。
最后,两个或者多个json文件,可以作为提示词,给到大模型,然后进行对话。
需要精确的聊天内容了,再用FC或者mcp技术,去调具体的聊天记录。
存储的json文件,可以随时聊天记录的增量,不断进化,引入遗忘机制,一件事件如果新旧有冲突,就把旧的存入到回收站json,当一段时间旧的没有翻案,则就遗忘。

我文笔和表达不太好,于是让gemini帮我完善...