Nekof 在 OpenAI o1模型的发布——一场精心的市场营销 中发帖
Introducing OpenAI o1-preview
从这个链接点进去,你下意识的第一反应是介绍OpenAI最新的o1-preview模型的表现,然后你看到了这一段
In a qualifying exam for the International Mathematics Olympiad (IMO), GPT-4o correctly solved only 13% of problems, while the reasoning model scored 83%.
卧槽,太牛了,模型在IMO水平的测试达到83%的正确率,AGI指日可待!
然而真相是什么呢?
获得83%这个成绩的是o1不是o1-preview,而o1并没有开放访问
这个测试也不是IMO,而是IMO的资格考试,实际上是AIME,美国高中生水平的测试,是用于选拔代表美国参加国际数学奥林匹克竞赛的学生的
8...