@allyn612Anthropic 官方出品的 skill-creator 更新了,可以自己迭代评测了! 中发帖

Anthropic 官方出品的元技能(用于创建技能的技能)更新了,主要新增/强化的功能点: 

skill-creator 从“写 skill 指南”升级为“可跑评测的 skill 开发/迭代闭环”:强调写测试用例、跑 with-skill vs baseline、收集结果、让用户在 viewer 里 review、再按反馈迭代。 (raw.githubusercontent.com
(https://raw.githubusercontent.com/anthropics/skills/cc5e418/skills/skill-creator/SKILL.md))
新增“触发率(description trigger)评测”脚本:scripts/run_eval.py 会对一组 query 调 claude -p,用 stream 事件判断该 skill 是否被触发,并输出 JSON ...