admin (@adminnyue)Claude 4 Sonnet without thinking 代码能力更好? 中发帖

各位佬友们,LiveBench 的测试中,Claude 4 Sonnet 的 Coding 分数比 Claude 4 Sonnet Thinking 的分数还要高,这是什么原因啊?思考反而会降低代码能力吗?有佬友测试也有这种感受吗? 
感觉有点奇怪
[image]