CNM 在找了些足够有难度的前沿数学题，供测试中发帖由于各类测试集越来越老，ai 越来越新，越来越强，老旧数学题可能不能测出新模型能力

CNM 在找了些足够有难度的前沿数学题，供测试中发帖

由于各类测试集越来越老，ai 越来越新，越来越强，老旧数学题可能不能测出新模型能力。 
例如， 
Omni-Math 中的难题还是十几年前的 IMO、Putnam 之类； 
 [来自 2001 年 IMO N5，已选入 Omni-Math] 
livebench 目前最新公开数据集在 11 月 25 日（且 livebench 6 个月才会完全更新，目前大部分 math 还是 8 月的）； 
 [image] 
MATH-500 之类更是污染烂了； 
而与之相对，Grok、Gemini 数据已经到了 2025 年，记个答案很合理 :tieba_087: 
 [image] 
我随便找的题，尽力保证难且新 :tieba_003: 
题目泄露日期：2025 年 3 月 20 日 :tieba_003: 
English


Fix positive integers k and d. Prov...