pwtramp123 在 Deepseek R1 正式版 对决 O1 关键几题 中发帖
Deepseek R1 正式版 对决 O1 关键几题
省流:作对对方作错的题目得1分,
比分 3:1
R1 渠道:官网WEB
O1 渠道:chat01.ai(比较稳定)
宗旨:我们只考虑对人来说比较简单,但是猜测模型并没有真正掌握的题目,而不是对人来说也非常困难,但是模型因为拟合却能答对,这样方能测试出真正能够泛化的那部分推理能力.要求尽量是新颖且0或者接近0知识背景.当然只能说尽量朝这个方向.
O1 √
R1 ×
智者的帽子(傻瓜)
三位智者 坐在一条长凳上。他们面朝同一个方向,,每人头上戴着一顶帽子。每位智者只能看到坐在自己前面的人的帽子,看不到自己和身后人的帽子。他们知道总共有5顶帽子,其中3顶是红色的,2顶是白色的。从中随机选择3项帽子给三位智者戴上.
第一个人(坐在最前面,看不到任何人):"你能确定自己帽子的颜色吗?"他说不能。
然后问第二个人(能看到最前...