作业君 (@homeworkkun)deepseek v3.2 Livebench已出分 中发帖

[图片] 
按照模型来说比V3.2 Thinking分数高的有:
Claude 4.5 Opus Thinking
Gemini 3 Pro Preview
GPT-5
GPT-5 Codex
GPT-5.1
Claude Sonnet 4.5 Thinking
GPT-5.1 Codex
GPT-5 Mini
Claude 4.1 Opus Thinking
reasoning:V3.2第九,Speciale第十
coding:V3.2第十六
agent coding:V3.2第十四
math:V3.2第十,Speciale第九
data analysis:speciale第三
language和if都不高我懒得数了,大家自己数吧(

分项目排名