@SugarBreeze 在 DeepSeekV3.1 Terminus 重回 Artificial Analysis 国产开源模型榜首 中发帖
https://x.com/ArtificialAnlys/status/1971114096008495501
[image]
相比上版本提升4分,关键子项成绩如下:
[Intelligence Evaluations (25 Sep '25)]
可惜 𝜏²-Bench 的成绩自 R1 0528 以来就没提升过,严重拖了后腿,不然有望到60分