a3members 在 livebench 怎么改了很多模型的coding分数 中发帖
gemini 2.5的coding分数我记得很高的啊 还有claude 3.7怎么coding分数也这么拉跨了
o3 mini反而是coding最高分了 这又是被oai收买了吗
gemini 2.5的coding分数我记得很高的啊 还有claude 3.7怎么coding分数也这么拉跨了
o3 mini反而是coding最高分了 这又是被oai收买了吗