Mozi (@yeahhe)似乎从R1发布后,各家模型更加在意跑分,但幻觉变严重? 中发帖

R1 
新版deepseek v3
o4 mini
grok
claude
等等
都是幻觉增加,跑分提升迅速