CybertronmtBabyVision:仅Gemini 3 Pro超过了人类3岁小孩的视觉理解水平 中发帖

最近有网友搞了一个视觉理解能力的评测:GitHub - UniPat-AI/BabyVision: We introduce BabyVision, a benchmark revealing the infancy of AI vision. 
只有Gemini 3 Pro超过了人类3岁小孩的水平:
[result]
评测原理很简单,就是让大模型去做一些“找不同”“连连看”“走迷宫”之类的视觉理解题目:
[full_table]
目前看来大模型对抽象的理解还是比较弱的