贺兰星辰 (@HikariLan) 在把 LLM 当成“人”，才是 Agent 工程进阶的起点中发帖从 2022 年底 GPT 横空出世到现在，大模型的各项指标都产生了质的飞跃：上下文窗口从 64K 飙升至 1M 以上，多模态能力从纯文本演进到可以秒懂复杂的图像与视频

贺兰星辰 (@HikariLan) 在把 LLM 当成“人”，才是 Agent 工程进阶的起点中发帖

从 2022 年底 GPT 横空出世到现在，大模型的各项指标都产生了质的飞跃：上下文窗口从 64K 飙升至 1M 以上，多模态能力从纯文本演进到可以秒懂复杂的图像与视频。然而，基座大模型能力的不断提升，正在揭示一件让工程师们既兴奋又抓狂的事情——LLM 在行为表现上越来越像人类了。 
随着“力大砖飞”的基座大模型逐渐展现出强大的原生规划能力，行业内开始出现一种声音，甚至以 Anthropic 为首的一些前沿组织开始抛出“Agent 工程无用论”，认为基座模型最终可以不依赖任何外部工程约束解决所有问题。 
但现实恰恰相反。无论基座 LLM 如何发展，在智械彻底代替人类的全部工作之前，“把 LLM 当成人类看待，顺应人类的认知心理学与行为学去设计系统”，将永远是任何 Agent/Harness 工程走向成熟的进阶起点。 
认知对齐：把 AI 当作你的“技术实习生”
如果你初次和 LLM 打...