mumong (@mumong05)agent开发问题请教 中发帖

佬友们请教个问题,我最近在用holmesgpt进行一个k8s运维agent的开发。我后台使用的大模型是deepseek,我用langgraph构建了4节点的工作流。最后一个是总结用来输出一个运维诊断报告的内容。 

现在我发现的问题是deepseek单次调用的token上限是8192token。但是我最终报告的输出可能需要更多的内容。我想知道这种情况下是怎么让我最终报告的内容扩展的?我想到的办法就是把报告分为多个模块比如4个,然后每个模块单独再调用一次,这样就是4*8192的内容。但是这样会不会导致多次生成的内容缺少联系感?
想知道大家针对这种情况有什么好的或者成熟的解决方式,总体来说可能是一个想让大模型输出超过它token上限的内容,但是又要保持整体内容的连贯而不能是完全独立。
[image]
顺便给佬友们看看我输出的结果,有没有实用性哈哈