LINUX DO Channel

Cybertronmt 在 BabyVision：仅Gemini 3 Pro超过了人类3岁小孩的视觉理解水平中发帖

最近有网友搞了一个视觉理解能力的评测：GitHub - UniPat-AI/BabyVision: We introduce BabyVision, a benchmark revealing the infancy of AI vision. 
只有Gemini 3 Pro超过了人类3岁小孩的水平： 
 [result] 
评测原理很简单，就是让大模型去做一些“找不同”“连连看”“走迷宫”之类的视觉理解题目： 
 [full_table] 
目前看来大模型对抽象的理解还是比较弱的