@stevessrFirst Proof | 旨在评估人工智能系统自主解决研究过程中自然出现问题的能力 中发帖

本项目代表了我们初步努力,旨在开发一套客观且现实的方法论,用于评估人工智能系统自主解决研究级数学问题的能力。在让这些想法在社区中发酵后,我们希望制定一个更有结构的基准。 
我们提出了一套多样化的10个研究级数学题目,内容涵盖代数组合学、谱图论、代数拓扑学、随机分析、辛几何、表示论、李群中的格、张量分析和数值线性代数。每个问题都是作者研究过程中自然产生的,且已通过大约五页或更少的校样得到回答,但答案尚未在线发布。