用户名 (@Linxzoom) 在 Agent开发-现状与疑惑中发帖佬友们好本人开发小白，做了一个智能体安全领域的Agent框架；目前遇到一个瓶颈，目前市面上对Openclaw，Hermes这类开源智能体，如果要获取到具体的工具调用链，思考路径等一系列内容，大致只能通过Hook那几个pre参数以及post参数去获取；但是很多实际测评情况下，是不允许对被测试的智能体做这种侵入式/半侵入式操作（白盒、灰盒）的，同时若是遇到类似CC,CODEX这类不开源的智能体，更是只能使用对话接口或通过API转发进行测试（黑盒）；最终，实际上是对被测智能体的对话返回内容做检查，而不是实际的任务调用，记忆调用，工具调用等内容的检查，希望佬友们可以指导一下，在这种场景下如何对智能体进行测试

用户名 (@Linxzoom) 在 Agent开发-现状与疑惑中发帖

佬友们好 
本人开发小白，做了一个智能体安全领域的Agent框架； 
目前遇到一个瓶颈，目前市面上对Openclaw，Hermes这类开源智能体，如果要获取到具体的工具调用链，思考路径等一系列内容，大致只能通过Hook那几个pre参数以及post参数去获取； 
但是很多实际测评情况下，是不允许对被测试的智能体做这种侵入式/半侵入式操作（白盒、灰盒）的，同时若是遇到类似CC,CODEX这类不开源的智能体，更是只能使用对话接口或通过API转发进行测试（黑盒）； 
最终，实际上是对被测智能体的对话返回内容做检查，而不是实际的任务调用，记忆调用，工具调用等内容的检查，希望佬友们可以指导一下，在这种场景下如何对智能体进行测试