翰林文苑 (@hanlinwenyuan) 在 信息学竞赛题目实测Deepseek R1 中发帖
题目全部来源于中国青少年信息学奥林匹克竞赛,使用官方数据进行评测
第一题(CSP-S 2023 T1,难度低,普及-)
[image]
本题o1 mini和Deepseek R1 全部正确!
第二题(NOIP 2023 T1,难度稍高一点点,普及-)
本题o1 mini 正确(59秒),Deepseek R1正确率50%以上(142秒),实属nb!
[image]
第三题(NOIP 2024 T1,难度十分高,
提高+/省选−,并且本题为2024年12月考的,绝对新题)
[image]
这个是真的意外惊喜。
o1 mini/o1 preview此题55分。
o1 最高100分。
只有o1 pro mode才稳定获得了100分的成绩,思考321秒,正确!
但是,Deepseek R1最高获得了70分的成绩!(思考两百多秒)
[image]
综上所述,我觉...