Sora (@qaz741wsd856)一道寻常高中生物题,竟能让一众SOTA模型折戟? 中发帖

问题来源: 
https://linux.do/t/topic/1608176
测试Prompt:
不用搜索,思考单从遗传学考虑,妈妈的妹妹和妈妈的儿子哪个与妈妈血缘和生物特性上最接近?

我本以为这种高中问题完全能被主流模型秒杀,结果我反复看了两眼Gemini Pro 3的回答之后,发现它说的自相矛盾:
[Screenshot_20260212_143101]
另外,3 Flash和2.5 Flash不开搜索也答不对,2.5 Pro不知道现在哪里还有…
而一直被我贬的(除NSFW外)一无是处的Grok轻松答对:
[Screenshot_20260212_145929]
另一位佬友发现Claude也答不对:
https://linux.do/t/topic/1608176/15
感觉很神奇,这个跟洗车问题不一样,不需要AI去猜隐藏上下文,只需要根据通识知识进行推理,甚...