koubibulaien 在 一次啼笑皆非的极不严谨ai测试(有反转?) 中发帖
目的是测试手上常用的各个渠道的claude opus4.5质量(太穷了,全是低价格的渠道),顺便加了点对照模型,我手动组织了场很不严谨的个人测试,因为存在断连问题,故全程手动。
测试十分不严谨,更多是主观臆断,仅供娱乐。不过整个过程跌宕起伏,最后有反转。
考官:codex+gpt5.2 high(team号,不保证不降智)
考题为flutter综合开发,是我正在进行的一个实际中型项目,是比较传统的一个小功能开发(前端后端都写)。gpt出题,gpt改题。要求先出方案再改代码,从方案和最终效果一起评价
满分120。 100基础分,20附加分。
考生:cc(88code),cc(anyrouter),antigravity(claude),antigravity(Gemini3pro h),codex(gpt5.2 high),trae cn(solo+自动)。
##最终成绩单(按单...