@HCPTangHYDeepSeek衍生论文:Visual Merit or Linguistic Crutch? A Close Look at DeepSeek-OCR 中发帖

论文地址: 

“学霸”还是“猜题高手”?
DeepSeek-OCR此前因其极高的压缩率和识别准确率在业内走红,号称能用极少的视觉信息读懂一整页文档。然而,论文却提出了一个尖锐的问题:AI是真的看清了字,还是在靠语言逻辑“瞎猜”?
为了验证这一点,研究人员给AI安排了一场特殊的“乱码考试”:

逻辑题: 当给AI看有逻辑的英文句子时,它表现得像个学霸,准确率接近90%。
乱码题: 当研究员故意打乱单词顺序,或者把字母换成毫无意义的随机字符时,DeepSeek-OCR瞬间“原形毕露”,准确率从90%直接暴跌到20%左右。

结论十分扎实: 这种模型高度依赖“语言拐杖”。它不是看清了每一个字,而是根据上下文的概率在猜。比如看到“DeepS___”,它会毫不犹豫地补全为“DeepSeek”,哪怕图片里印的其实是别的词。
“8.5k悬崖”:压缩不是无限的
研究团队还发现了一个有趣的现象——“...