@yeatse 在 有没有什么具体的 case,能明显看出来 GPT-5 比 GPT-4o 和 o3 强的? 中发帖
类似鲁迅和周树人、树上7只鸟开枪打死1只还剩几只这种问题,可以明显看出来当年的 GPT-4 比 GPT-3.5 强。
现在有没有 4o 和 o3 答不对,但是 GPT-5 能答对的问题?已知 9.11 和 9.8 还是比不了大小。