诺河 (@nuohe)关于gpt5.5个人一点小的测评 中发帖

在一个黑色的袋子里放有三种口味的糖果,每种糖果有两种不同的形状(圆形和五角星形,不同的形状靠手感可以分辨)。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目,那么,最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖?(同时手中有圆形苹果味匹配五角星桃子味糖果,或者有圆形桃子味匹配五角星苹果味糖果都满足要求)

苹果味 桃子味 西瓜味
圆形 7 9 8
五角星形 7 6 4

用来跑上述问题
测试账号 Pro订阅
IP 一致
5.4 xhigh 回复正确答案21
5.5 xhigh 回复29
在加上 你必须要深度思考这个问题后 回复正确答案21
[image]
粗浅结论:
5.5比5.4更像一个人,5.4是以理论来解决问题,而5.5是实践来解决问题。
代码层面:5.5的测试变多了 会积极读取上下文(不知道是不是错觉运行两次...