无 (@wus) 在 简单谈谈近期使用GPT 5.5和5.4的感受。一点碎碎念 中发帖
最近一个月5.5出了,然后大家都说5.5“说人话”提升很多,我去试用一下。感觉上,在大部分场景,这两模型能力区别不是很大。而且我更推荐使用5.4 😆
而且大家说5.5更加说人话了。说实话,我体感上感觉还没啥感觉,也许是已经被5.4给训化,已经习惯了5.4的语气了。我反而感觉5.5它有个很大的致命缺陷,就是它很容易过度执行或者过度自信。
过度自信的问题就是:就比如说在有一定上下文的时候。问一个具体的名词的问题,按照5.4的逻辑,它肯定会去联网搜索一下,或者去盯一下代码,然后再给结果。但是5.5就觉得自己很懂,然后也不调用任何联网搜索,就直接给我回答。结果就很不可信。你必须得加一个,比如说给出过程,或者说先网页搜索提示词5.5才能去搜索。 🙃
然后随之而来的附加问题就是,它有一种豆包的感觉,就是前面说过于自信的做完事,然后最后去给你认错。我只能说确实有一点说“人话”,但是我觉得这一点也不...