WakeUp-Jin 在上下文工程之Agent评估中发帖Agent的评估前言：《Claude-Cookbooks》：https://github.com/anthropics/claude-cookbooksLangFuse 的文档：https://langfuse.com/docs/evaluation/overviewpromptfoo 框架：

WakeUp-Jin 在上下文工程之Agent评估中发帖

Agent的评估
前言：

《Claude-Cookbooks》：https://github.com/anthropics/claude-cookbooks
LangFuse 的文档：https://langfuse.com/docs/evaluation/overview
promptfoo 框架：https://github.com/promptfoo/promptfoo

本文有参考和借鉴上面几篇文章的概念，同时也做了一些拓展性的理解和深入，今天又读到一篇好文，和各位佬友分享一下：Generative AI in the Real World: Context Engineering with Drew Breunig – O’Reilly 
里面也提到Agent评估的重要性，同时提出一个新的概念“系统工程”，提示词工程 - 上下文工程 - 系统工程， 
目前正处于上下文工程演变的...