Mayrain (@Mayrain5) 在 论codex的幽默虚假测试 中发帖
我:你把这个系统跑一下,然后把它的整个跑的流程固化下来,形成我们展示的基础。
Codex:(一顿猛猛干,一顿稳)
Codex:结果非常成功!
我:(点进去一看)
Codex写了个py脚本直接把整个链路的所有“模拟结果”(他自己认为的结果)用硬编码编辑出来然后直接生成一个虚假测试结果。
。。。。。。我在想这毛病是只有codex有还是其他模型也有……太蠢了……问题是我开的5.5 xh,按理来说不至于这么蠢吧。我写了几版Prompt都压不住