不会起名字啊 (@KEEPMOVE)英国 AI 安全研究所 (AISI) 发布大模型安全评测工具 ControlArena 中发帖

大模型安全和评测这块,之前出的 Inspect 框架的英国 AI 安全研究所 (AISI) 。最近他们又开源了新工具 ControlArena。 
这玩意主要用来在受控的沙盒环境里,自动化评估大模型 Agent 的自主性边界和潜在危险能力。
官网:

项目: