Loveyless【模型大横评!】GPT5.5/5.4/5.3 | Opus4.8 | Kimi2.6 | GLM5.1 中发帖

我是一个重度的codex用户,从GPT5.1~5.5,都是一直在工作或者生活中使用。 
我也很信奉一句话,就是不要在低级模型上浪费时间~~
但是同样我也是对AI有兴趣的,所以说我也想来做一些模型横屏,其实一直都想做了,但是一直没有时间,因为国产模型之前一直都是差很多,但是GLM5.1确实是进步不小,但是我一直都没有用过,所以说我也想来测一下。
1. 测试项目
本人的一个闭源项目,以下是架构和复杂度介绍
[image]
[image]
2. 题目和评判
评判和题目全部由GPT 5.5 xhigh所出,并且题目经过15轮自问自答优化。
AI一共出了6道题,最后我在让他自问自答,最后他只选了三道题
分别是第一题、第四题、第六题
[image]
[image]
[image]
3. 模型渠道和cli版本
GPT自费购买的中转站,我觉得包真的,因为我工作也一直在用
Kim...