图 (@37012) 在 发现一个绝大部分大模型无法答对的问题(国产大模型全军覆没) 中发帖
小红有3个姐姐,2个妹妹,小红的妹妹小美有几个姐姐?问题有唯一解吗?
战绩如下:
grok3(思考)每次都对
grok3 偶尔能对
claude 3.7 偶尔能对
claude 3.5 偶尔能对
o3-mini (几家中转站都有问题 没测出来)
o1-pro 全错
gpt-4o 全错
Gemini 2.0 Pro Exp 02-05 全错
deepseek r1(官方)全错
deepseek v3(官方)全错
qwen-max-latest 全错
Doubao-1.5-pro- 32k-250115 全错
单从这个问题来看 大模型基本上全军覆没,仅grok3思考版 能稳定回答正确
大家也可以实验一下~