ship (@shipship) 在 数学最强依旧是gemini 2.5pro 中发帖
[image]
这个佬友的这些题,实测翻译为英文后,只有gemini都能做出来,o3和o4mini-high在第六题都失败,第八题都忘了考虑零点。
符合livebench数学一栏的评分
[image]
这个佬友的这些题,实测翻译为英文后,只有gemini都能做出来,o3和o4mini-high在第六题都失败,第八题都忘了考虑零点。
符合livebench数学一栏的评分