Oceanuo (@phlegm) 在 gemini-2.0-flash-thinking-exp-01-21 强的离谱 中发帖
在数学题方面,有一些问题R1答对,O1不对,O1对R1不对,有些Groq对,有些Groq不对,把这些问题全部给gemini-2.0-flash-thinking-exp-01-21测试,对到完,没有开code execution,还没有测试代码,没有时间,有时间的佬可以去测试。网页版卡又慢,aistudio比较好