Y.Ma (@Alreschan)GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同 中发帖

在Kimi-K2.6技术报告中和DeepSeek-v4技术报告中,Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同(Gemini和Calude是相同的),引用值分别为65.4和75.1,这是有什么讲究吗? 
Kimi-K2.6技术报告截图如下:
[截屏2026-04-24 11.55.12]
DeepSeek-v4技术报告截图如下:
[截屏2026-04-24 11.55.22]