pwtramp123deepseek这就放出来了,是不是有点急躁 中发帖

模型推理能力评定 附例题 更新O1mini测试情况 O1mini评价降低 之前的简单题仍然不行 
傻瓜帽子题和判断说谎问题仍然作不对啊…基础逻辑还是欠缺.