作业君 (@homeworkkun) 在 deepseek v3.2 Livebench已出分中发帖[图片] 按照模型来说比V3.2 Thinking分数高的有： Claude 4.5 Opus Thinking Gemini 3 Pro Preview GPT-5 GPT-5 Codex GPT-5.1 Claude Sonnet 4.5 Thinking GPT-5.1 Codex GPT-5 Mini Claude 4.1 Opus Thinking reasoning:V3.2第九，Speciale第十 coding：V3.2第十六 agent coding：V3.2第十四 math:V3.2第十，Speciale第九 data analysis：speciale第三 language和if都不高我懒得数了，大家自己数吧（ ▶ 分项目排名

作业君 (@homeworkkun) 在 deepseek v3.2 Livebench已出分中发帖

[图片] 
按照模型来说比V3.2 Thinking分数高的有： 
Claude 4.5 Opus Thinking 
Gemini 3 Pro Preview 
GPT-5 
GPT-5 Codex 
GPT-5.1 
Claude Sonnet 4.5 Thinking 
GPT-5.1 Codex 
GPT-5 Mini 
Claude 4.1 Opus Thinking 
reasoning:V3.2第九，Speciale第十 
coding：V3.2第十六 
agent coding：V3.2第十四 
math:V3.2第十，Speciale第九 
data analysis：speciale第三 
language和if都不高我懒得数了，大家自己数吧（ 
▶ 
分项目排名