公司做了一个系统的智能体,实现基本问答(天气之类的)、结合不同系统用,完成基本操作(查询待处理项,查看详情等,后续会持续加),现在初步搭起来的,也对接了一个系统的部分接口,让测试 目前能想到的是: 基本问答(试了下,只能问什么答什么,没有长对话)已对接接口的数据操作未对接接口的操作(还没对接删除,但回答已经删了 🤣)敏感话题历史记录想知道智能体的测试方法思路,测试点、还有哪些方面要测试的,有什么方式能协助测试的工具之类的。