𝓵𝓮𝔃𝓲𝓼𝓱𝓮𝓷 (@lezishen) 在 Claude Opus 4.1 模型登场,软件工程能力再攀新高峰 中发帖
IT之家 8 月 6 日消息,Anthropic 公司今天(8 月 6 日)发布公告,宣布推出 Claude Opus 4.1 模型,相比较今年 5 月推出的 Claude 4 系列模型,主要改进了编码、推理和执行指令的能力。
Anthropic 表示,Claude Opus 4.1 在 SWE-bench Verified 上(用于评估软件工程准确性)提升到了 74.5%,作为对比,Claude Sonnet 3.7 的准确率为 62.3%,而 Claude Opus 4 的准确率为 72.5%。具体来说,更新后的模型在“深度研究和数据分析技能,尤其是在细节追踪和代理搜索方面”表现得更加出色。
[image]
[image]
探索 AI 写代码极致:Claude Opus 4.1 模型登场,软件工程能力再攀新高峰 - IT之家