CNM找了些足够有难度的前沿数学题,供测试 中发帖

由于各类测试集越来越老,ai 越来越新,越来越强,老旧数学题可能不能测出新模型能力。 
例如,
Omni-Math 中的难题还是十几年前的 IMO、Putnam 之类;
[来自 2001 年 IMO N5,已选入 Omni-Math]
livebench 目前最新公开数据集在 11 月 25 日(且 livebench 6 个月才会完全更新,目前大部分 math 还是 8 月的);
[image]
MATH-500 之类更是污染烂了;
而与之相对,Grok、Gemini 数据已经到了 2025 年,记个答案很合理 :tieba_087:
[image]
我随便找的题,尽力保证难且新 :tieba_003:
题目泄露日期:2025 年 3 月 20 日 :tieba_003:
English


Fix positive integers k and d. Prov...