kkqy 在 通过问2025年的事情区分claude opus模型, 还真有区别 中发帖
我和朋友的几个PLUS号额度用完的时候,会时不时用公益站来顶一下。
最近公益站的GPT也拉闸了,然后看到有人讨论claude opus 4.8是否真实的事情。
我没参与讨论,但是看到有佬友回复说可以通过考验知识库来测试。
一下子勾起我好奇心了,然后试了一下,还真有区别。
测试时间:2026.06.15 04:50
先说结论,测试了4个公益站,只有1个众所周知的公益站回答正确。
我问的问题是:2025年中国举行了阅兵吗?
这个应该算是比较重大的事件了,但是只有某众所周知的claude公益站能答对。
正确的回答:
某众所周知的claude公益站:
[{3B7C011F-AA68-4545-8220-2A4D22825AE2}]
其它3个公益站的opus 4.8全军覆没:
公益站1:
[{B4FC7231-0A01-4A9D-81A7-75A44C10E372}]
...