佩恩 (@carlpayne) 在 讨论谁家 claude-3.7-sonnet-thinking 更蠢(关于 budget_tokens) 中发帖
源于帖子 关于Claude3.7sonnet,你想知道的一切…… 中的测试题:
雨滴开始自由下落时质量为 \(m_0\)。在下落过程中,单位时间凝聚的水汽质量为 \(\lambda\) (\(\lambda\)为常量)。
试求雨滴经过时间 \(t\)下落的距离。忽略空气阻力。重力加速度为\(g\)。
正确答案为:
s(t)=\frac{gt^2}{4}+\frac{gm_0t}{2\lambda}-\frac{gm_0^2}{2\lambda^2}\ln\left(1+\frac{\lambda t}{m_0}\right)
我的 Cursor Pro 怎么也算不对,并且思考內容显著少于同一问题在 Claude Pro 下的思考內容。遂做了以下测试:
以下內容中使用 c37s-t 代指 claude-3.7-sonnet-thinking,每个平台测试 >=2 次求平均
...