codeboy 在测试了一下主流AI模型做高考语文题的能力中发帖仅供娱乐

codeboy 在测试了一下主流AI模型做高考语文题的能力中发帖

仅供娱乐。评分模型是 Gemini 2.5 Pro，根据官方参考答案打分，所有测试和评分仅做一遍 
测试用卷：2024年高考全国甲卷语文试题及参考答案（最终定稿）.docx (86.1 KB) 
各AI模型在2024年全国甲卷语文（除作文部分）表现对比 




模型
现代文阅读 (总分/36)
(一)论述类 (9)
(二)实用类 (12)
(三)文学类 (15)
古代诗文阅读 (总分/34)
(一)文言文 (19)
(二)古代诗歌 (9)
(三)名篇名句 (6)
语言文字运用 (总分/20)
(一)语言I (14)
(二)语言II (6)
总分 (90)
百分比 (%)




Gemini 2.5 Pro (05-06)
35
9
11
15
30
18
8
4
15
9
6
80
88.9%


Claude 4.0 Opus
32
9
12
11
29
18
7
4
18
13
5
...