@neco-Arc如何试探模型智商与上下文窗口大小 中发帖

近期,公司推了一个agent软件,内置账号,未知模型,未知上下文窗口。如何推断context windows大小?如何评估智力? 
用对话的形式粘贴了400k字符,让它找了几个特定位置,10个问题里面找对了9个,还有一个我让它找Record 10000它给我的是 Record 10080的值,但是让它找第10221项又是对的。(图一乐,谁知道是不是把超过一定长度的对话自动转成了txt搁那直接开查,但是答错了一题让我觉得很蛆)
试了一下糖果题,思考半天,输出29
附上gpt5.4-xhigh的回答:
[图片]