F-Droid腾讯AI团队发现DeepSeek R1等思考的缺陷并给出了解决办法 中发帖

[图片] 
结论:错误答案往往更冗长,但并未提升解题正确率。