YooHakimi看到大家讨论516降智问题,我也测试了一下。 中发帖

首先我先说一下我的环境:CPA 代理,目前只有一个可用账号,且 IP 没变过。 
为了做对比,我拿了两个目录分别运行 CodeX(走的都是 CPA,同 IP 同账号进行提问)。这两个目录唯一的变量是:
一个是空目录,没有任何项目历史记录;
另一个是正在使用的目录,里面有一个 Agents.md 文件,包含了一些日常比较严谨的约束规范。
实验结果很明显:
第一个空目录:它直接就 516 了,而且回答也是错的。
第二个目录:同个问题、同个账号、同个 CPA、同个 IP,但它的回答非常仔细。它分析出了问题中语义层面的区别,比如 “完全盲取” 和 “凭手感盲取” 这几种条件。我看了一下,思维链长度直接到了 3000 多。
基于这个情况,我怀疑这东西是不是撞了缓存。
可能同个问题问多了,系统就直接撞缓存输出 516;但如果你的上下文有其他内容(比如文件里的约束)进行干预,导致缓存没对上...