@neco-Arc 在如何试探模型智商与上下文窗口大小中发帖近期，公司推了一个agent软件，内置账号，未知模型，未知上下文窗口

@neco-Arc 在如何试探模型智商与上下文窗口大小中发帖

近期，公司推了一个agent软件，内置账号，未知模型，未知上下文窗口。如何推断context windows大小？如何评估智力？ 
用对话的形式粘贴了400k字符，让它找了几个特定位置，10个问题里面找对了9个，还有一个我让它找Record 10000它给我的是 Record 10080的值，但是让它找第10221项又是对的。（图一乐，谁知道是不是把超过一定长度的对话自动转成了txt搁那直接开查，但是答错了一题让我觉得很蛆） 
试了一下糖果题，思考半天，输出29 
附上gpt5.4-xhigh的回答： 
 [图片]