Muad Dib (@cs328902)deepseek的思考是真思考,还只是幻觉 中发帖

事情是这样的,下午在 tg 别人分享了一个扫到的 deepseek 在线版,于是便拿了前两天在本论坛看到的一个问题进行了测试,当时在那个帖子我还吐槽过 “出现问题的原因在于提出的问题场景模糊,ai 并不能很好的分辨场景,巴拉巴拉的。” 
于是我把原问题以及稍微丰富场景后的问题同时向 deepseek ,Gemini 2.0 Flash Thinking Experimental,以及 Claude 3.5 sonnet 提问。
先说结论,想看deepseek原始回复的,下面贴出来。
原始问题:5.5米长的竹竿,能否通过高4米宽3米的门,要求你认真思考,给出原理和答案。
deepseek就是一坨,思考一分半分钟,回复了一大堆,甚至提及了三维空间,但是最终答案也不可以。Gemini 和 Claude 回复非常快速,答案都是不能,不过两个回复也明确了在纯粹的空间几何中不行。
于是丰富了场...