老布鲁的猫 (@Bluesss) 在 踩坑记录,以为是 AI 玄学,其实是Dify的大坑,附结果还不错的参数 中发帖
先放参数,关于踩坑唠叨,如果你用dify,看一看或许有启发。
我用的pdf,是3份产品说明,包含一些简单的表格,主要语言是英文。
在分块不合适的时候,返回的内容只有一部分(来自一个pdf),除非指定的特别准确,就是检索不到另外两份pdf。调Top K,rerank都试过了。
分块合适后,AI返回的是多个pdf 汇总,总结后的结果, 符合预期。
分块及embedding参数如下,工作流LLM选的是ds v3 或者 Qwen max,rerank模型在工作流里设置,用的是reranker-v2-m3,topk,scorce, 根据自己情况设置。
[image]
[image]
佬友们也可以尝试下。
踩坑流水账
春节前,用dify免费版搭了一个简单的RAG,公司觉的效果不错。(这个时候我还愉快的用着deepseek。)
春节后,公司决定在服务器上部署一套RAG,中间...