贺兰星辰 (@HikariLan)把 LLM 当成“人”,才是 Agent 工程进阶的起点 中发帖

从 2022 年底 GPT 横空出世到现在,大模型的各项指标都产生了质的飞跃:上下文窗口从 64K 飙升至 1M 以上,多模态能力从纯文本演进到可以秒懂复杂的图像与视频。然而,基座大模型能力的不断提升,正在揭示一件让工程师们既兴奋又抓狂的事情——LLM 在行为表现上越来越像人类了。 
随着“力大砖飞”的基座大模型逐渐展现出强大的原生规划能力,行业内开始出现一种声音,甚至以 Anthropic 为首的一些前沿组织开始抛出“Agent 工程无用论”,认为基座模型最终可以不依赖任何外部工程约束解决所有问题。
但现实恰恰相反。无论基座 LLM 如何发展,在智械彻底代替人类的全部工作之前,“把 LLM 当成人类看待,顺应人类的认知心理学与行为学去设计系统”,将永远是任何 Agent/Harness 工程走向成熟的进阶起点。
认知对齐:把 AI 当作你的“技术实习生”
如果你初次和 LLM 打...