jaysowen 在 Anthropic 正式发布 Claude Opus 4.8。 中发帖
先上官方评测图
[a9007019094f217e98cb8261a2765d7646c01708-2600x1392]
这次升级的重点已经不只是“更聪明”,而是明显在往真正的 AI Agent 方向走。
官方重点提到的能力包括:
更强的 coding 和 agentic task
更好的 computer-use / browser-agent 能力
更长任务链稳定性
更强 multimodal(PDF、图表、非结构化内容)
更低 hallucination
更高 honesty(更愿意承认不确定性)
更强 self-check 与 error recovery
官方数据显示:
Online-Mind2Web 达到 84%
Browser agent / computer-use 能力明显超过 Opus 4.7
企业 agent 场景推理能力大幅提升
多步任务速度更快
t...