Lilo啊?这才是o1的实力吗? 中发帖

早上做了个比较有难度的数独,扔各大推理模型试了一圈 
deepseek/gemini 差不多是一个方向,会把思考过程写的很细
deepseek会在思考300左右的时候直接放弃思考(也许token限制要到了),快速给你一个结果,当然,结果是错误的,不过他会嘴硬说这是正确结果
gemini 同样可能输出错误的结果或者陷入复读
Let's look at R4C1, R4C5, R4C7, R4C9 again. R4C1: 179, R4C5: 179, R4C7: 179, R4C9: 179.
Naked Quad {1, 7, 9} in R4C1, R4C5, R4C7, R4C9.
This means in Row 4, cells R4C1, R4C5, R4C7, R4C9 must be filled with 1, 7, 9, and one other number...