黄师傅 (@highkay) 在最近的一些关于gpt系列模型推理强度的小观察中发帖最近主要用gpt-5.4和5.2，有一些不太常见的小经验给大家分享一下

黄师傅 (@highkay) 在最近的一些关于gpt系列模型推理强度的小观察中发帖

最近主要用gpt-5.4和5.2，有一些不太常见的小经验给大家分享一下。 

codex用plan，推理强度会自动给你限制到中等。有点奇怪对吧，看到最后说说你的想法。
同一个问题，推理强度越高，烧的token越多，我大概的经验是，min和None思考都是空的，low大概是100，med大概是200-300，high可以干到1000左右，xhigh大概1200到1500，这个肯定是不准确的，大概意思了解一下，其实模型如果没变的话，烧的token越多就越智能，这个智能的差距大概是这样，所以你用high开始配额燃烧速度非常非常快，xhigh反而提升没那么大了。这个是5.4的。
如果一个偏主观的问题，比如答复高中低吧，没有准确的答案的那种，不同的强度答案差距不大，但是我加入了置信度的话，会有差别，是一个微笑曲线，no和low这种置信度会很高（盲目自信？），med会比较低，xhigh会比较高。所以这...