@icy使用 DeepSeek R1 和 o1 发现有趣的区别 中发帖

丢了几道题同时给两个模型,感觉到的区别,不知道大家有没有同感。 
在做同一道题的时候,如果第一次模型回答错了,给他发答案错误,请重新思考时:
o1 会立即承认错误,然后给出另一个错误答案
R1 会重新用同样的思维计算一遍,然后给出同一个错误答案
然后给模型纠正一些答案出错的点,
o1 会根据你的思维作一些调整,然后给出另一个错误答案
R1会继续思考一段时间,又给出同样的错误答案
感觉 o1 像喜欢讨好老师的学生,不喜欢坚持自己的答案,但也更能接受意见
R1 像比较固执的学霸,坚持自己的逻辑和答案,不太受其它人意见影响