pwtramp123 在 deepseek这就放出来了，是不是有点急躁中发帖模型推理能力评定附例题更新O1mini测试情况 O1mini评价降低之前的简单题仍然不行傻瓜帽子题和判断说谎问题仍然作不对啊…基础逻辑还是欠缺.

pwtramp123 在 deepseek这就放出来了，是不是有点急躁中发帖

模型推理能力评定 附例题 更新O1mini测试情况 O1mini评价降低 之前的简单题仍然不行 
傻瓜帽子题和判断说谎问题仍然作不对啊…基础逻辑还是欠缺.