WakeUp-Jin上下文工程之Agent评估 中发帖

Agent的评估
前言:

《Claude-Cookbooks》:https://github.com/anthropics/claude-cookbooks
LangFuse 的文档:https://langfuse.com/docs/evaluation/overview
promptfoo 框架:https://github.com/promptfoo/promptfoo

本文有参考和借鉴上面几篇文章的概念,同时也做了一些拓展性的理解和深入,今天又读到一篇好文,和各位佬友分享一下:Generative AI in the Real World: Context Engineering with Drew Breunig – O’Reilly
里面也提到Agent评估的重要性,同时提出一个新的概念“系统工程”,提示词工程 - 上下文工程 - 系统工程,
目前正处于上下文工程演变的...