Y.Ma (@Alreschan) 在 GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同中发帖在Kimi-K2.6技术报告中和DeepSeek-v4技术报告中，Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同（Gemini和Calude是相同的），引用值分别为65.4和75.1，这是有什么讲究吗？ Kimi-K2.6技术报告截图如下： [截屏2026-04-24 11.55.12] DeepSeek-v4技术报告截图如下： [截屏2026-04-24 11.55.22]

Y.Ma (@Alreschan) 在 GPT-5.4跑分在K2.6和DeepSeek-v4技术报告中不同中发帖

在Kimi-K2.6技术报告中和DeepSeek-v4技术报告中，Terminal Bench 2.0测试结果引用的GPT-5.4 xHigh跑分不同（Gemini和Calude是相同的），引用值分别为65.4和75.1，这是有什么讲究吗？ 
Kimi-K2.6技术报告截图如下： 
 [截屏2026-04-24 11.55.12] 
DeepSeek-v4技术报告截图如下： 
 [截屏2026-04-24 11.55.22]