@Bink 在 多轮对话后,上下文怎么管理? 中发帖
当用户跟llm多轮对话之后,佬们是怎么管理上下文的 是直接截断?还是把用户跟llm回复的一股脑全部丢进去呢?还是有什么别的方法来管理这种多轮上下文的管理,来节省token
当用户跟llm多轮对话之后,佬们是怎么管理上下文的 是直接截断?还是把用户跟llm回复的一股脑全部丢进去呢?还是有什么别的方法来管理这种多轮上下文的管理,来节省token