致祊 宋 (@user1308) 在 Claude4比3.7思考程度要浅 中发帖
给他同样的文献综述工作,一样的prompt,一样的追问,最后得出的结果A(3.7),B(4)。
3.7在格式上能够按照要求,4在追问一次后格式就变了,虽然二者思考时间上差不多,但是思考链输出内容4很泛泛,基本是总结,3.7比较具体。
[image]
让4自己评判,4认为A效果更好