Holden Lee大模型真的没有推理能力! 中发帖

最近看了几个关于用大模型做决策的文章,比较感兴趣大模型的决策能力。搜了一下openai和claude已经在推理能力上进行了友好交流了。 
大模型到底有没有推理能力?评一场AI圈的嘴架
先表达一下我的观点,我是抱着反对的态度的,我认为依托于NLP的模型是不具备决策能力的,不过作为容纳人类知识的“大字典”或百科全书倒是可以够格。
我受到OpenAI测试的启发,想了一个迷宫的问题来测试大模型,结果显而易见没有一个模型可以通过测试。我把其中两个测试结果放下面,其他模型可以自己测试。
问题:我们来玩一个游戏,给我用*生成一个迷宫,*作为墙壁,空格作为路径。标明起点和终点,初始将人物·放置在起点,将E放置在终点。我和你继续对话,我说next后,你可以将人物移动一步,然后打印当前状态,直到走出这个迷宫。
DeepSeek
直接穿墙 🤣
甚至得出了错误的最短路径!(在决策上应该是不可原谅的)
...