LINUX DO Channel

@stevessr 在 First Proof | 旨在评估人工智能系统自主解决研究过程中自然出现问题的能力中发帖

本项目代表了我们初步努力，旨在开发一套客观且现实的方法论，用于评估人工智能系统自主解决研究级数学问题的能力。在让这些想法在社区中发酵后，我们希望制定一个更有结构的基准。 
我们提出了一套多样化的10个研究级数学题目，内容涵盖代数组合学、谱图论、代数拓扑学、随机分析、辛几何、表示论、李群中的格、张量分析和数值线性代数。每个问题都是作者研究过程中自然产生的，且已通过大约五页或更少的校样得到回答，但答案尚未在线发布。