@HCPTangHYGPT 5.4测评:模型很强,但Juice掺水 中发帖

先放结论 
[image]
对于我这个题库来说大概gpt已经没意义了,无非是持续优化蠕动一两分
而High打不过5.3codex high,主要就是因为juice掺水。当前team反代的5.4 high只有96juice,而5.3codex high是256


放一些xhigh结果


[image]
[image]
[image]