@HLiny 在 [toyama nao的榜单] Gemini 3.5 flash逻辑分数接近deepseek V4 pro max 中发帖
Nao的榜单上,gemini 3.5 flash逻辑成绩已出,非常亮眼。
极限成绩接近deepseek V4 Pro (max),中位成绩仅次于 gpt-5.5(xhigh) 和 opus 4.6(think)。
同样成本也大幅上涨,和Gemini 3.1 pro相当,但还是明显低于Opus 4.6 和gpt 5.5
[图片]
编程已经在测,看起来也不错,估计有glm5.1的水准
[图片]