RoderickZH知识稀疏下的RAG,想针对这个场景进行RAG优化,求研究生大佬给一些Idea,想毕业。 中发帖

研二档,目前做RAG,开题开的是信息稀疏下进行RAG的优化,但是完全不知道应该怎么优化。 
目前想到的也都是缝合怪。

缝一个Web搜索更新知识库
缝一个多重检索(单词匹配+语义相似度)
缝一个验证模块,验证检索到的知识和问题是否相关
缝一个重排序模块,
最后缝一个嵌入过程,不把知识作为prompt,而是把知识作为参数传给LLM,使其不用解析。

但这些现在都有人做了,还有什么可以做的啊。
开题写的是缝一个数据增强模块,将检索到的知识重构成为新的格式,然后微调一下LLM,使其能够更好的从新的格式下的知识里面挖掘有效信息。
但是完全不知道该怎么做,现在没baseline,也没数据,也没想法。
求帮助,有大佬带可以有偿(分期),目前学生,一次可能给的比较少,找到实习后可以+钱。
可以弄个合同,(我不会跑路)
看了很多科研机构,但都太贵了,最便宜的也要3w块,一次属实拿不出来。
孩...