@leftxx 在 想问一下各位佬有没有什么测试gemini3pro是否降智的方法呀? 中发帖
日常使用gpt和gemini审合同时发现,输入相同的文件,相同的提示词,gpt虽然思考的时间会久一点,但是输出的内容更加详尽,gemini顶多思考2-3分钟就能输出审查意见,但是完整度远不及gemini,使用了这个题库“一个棱长为30厘米的立方体铁块,从8个角各去掉一个棱长10厘米的立方体铁块。然后放入一个底面积为2500平方厘米,原本盛有20厘米水的容器。放入后水位是多少厘米”测试了一下,gemini给出的答案是27cm