IkedaTeresa 在 gpt-5.4在长时任务上真的蛮半成品的 中发帖
用了两天, 给我的感觉就是很不稳定, 神一场鬼一场那种, 虽然分析能力实际体验下来相比之前更上了一层, 但是稳定性相比较5.2-xhigh差太多了, 特别是在重思考负担任务上, 强制思考链回报导致上下很容易脱节了.
除此之外, 还特别喜欢偷懒, 在codex里进行长时调参coding时, 我可以只用提示词让5.2-xhigh自动驾驶调参任务并主动分析迭代调整直到满足某个数值需求才停止. 而5.4-xhigh的等待非常不积极, 很喜欢进行一次迭代后, 甚至终端的任务还没出结果就直接停止对话. 不知道佬友是否和我一样有类似的体验.🥲