@yeahhe【长期更新Wiki】语言模型区分题库:测试逻辑能力,区分语言模型。测试模型是否降智 中发帖

由于之前的帖子不能打开Wiki,遂重建帖子,文档共建。 
本题库主要目的是区分不同语言模型,测试模型是否降智或阉割,也可以用作逻辑能力测试。




序号
题型
题目
答案






1
班级选课交集最大值
一个班级总共有30名学生。心理学、社会学和市场营销专业的学生人数分别是总人数的2/5、4/15和1/3。问:这三门课程中,最多有多少名学生同时报名了其中的两门课程?
15
🟧o1, 🟡o1-preview,🔴o1 pro
🟫Claude 3.5 sonnet,🟩DeepSeek-R1-Lite, Gemini 1.5 Pro, 🟪gemini-exp-1121, 🟢gemini-exp-1206,GPT4o, 🟥GLM4 Plus, 🟨Kimi数学版, 🟦o1-mini(不稳定),🟠QwQ-32B-Preview


2
几何
在正四棱台 ABCD-A1B1C1D1中...