pwtramp123 在 deepseek这就放出来了,是不是有点急躁 中发帖
模型推理能力评定 附例题 更新O1mini测试情况 O1mini评价降低 之前的简单题仍然不行
傻瓜帽子题和判断说谎问题仍然作不对啊…基础逻辑还是欠缺.
模型推理能力评定 附例题 更新O1mini测试情况 O1mini评价降低 之前的简单题仍然不行
傻瓜帽子题和判断说谎问题仍然作不对啊…基础逻辑还是欠缺.