用户名 (@Linxzoom) 在 Agent开发-现状与疑惑 中发帖
佬友们好
本人开发小白,做了一个智能体安全领域的Agent框架;
目前遇到一个瓶颈,目前市面上对Openclaw,Hermes这类开源智能体,如果要获取到具体的工具调用链,思考路径等一系列内容,大致只能通过Hook那几个pre参数以及post参数去获取;
但是很多实际测评情况下,是不允许对被测试的智能体做这种侵入式/半侵入式操作(白盒、灰盒)的,同时若是遇到类似CC,CODEX这类不开源的智能体,更是只能使用对话接口或通过API转发进行测试(黑盒);
最终,实际上是对被测智能体的对话返回内容做检查,而不是实际的任务调用,记忆调用,工具调用等内容的检查,希望佬友们可以指导一下,在这种场景下如何对智能体进行测试