@Moeblack人类的终极问题,你能回答几题? 中发帖

非营利组织“人工智能安全中心”(CAIS)与提供数据标注和 AI 开发服务的公司 Scale AI 联合推出了一个名为“人类终极考试”(Humanity’s Last Exam)的新型基准测试,旨在评估前沿 AI 系统的综合能力。这一测试因其极高的难度引起关注。 
——————
命名的意思在于,如果AI能大部分回答正确,人类就完蛋了(
地址:https://agi.safe.ai/
第一题和第二题我就看傻了,我感觉我的正确率是0诶。
[9fcaa54f139d8fa9abe3fba840cf8ccf]
[cb6ae994408b1ba80f23b25a838a6ff8]
————
给上几个AI的得分
[f06e47e84a9bfd5806829eecb0f974ca]
————
R1好强(