@HCPTangHY 在 DeepSeek衍生论文：Visual Merit or Linguistic Crutch? A Close Look at DeepSeek-OCR 中发帖论文地址： “学霸”还是“猜题高手”？DeepSeek-OCR此前因其极高的压缩率和识别准确率在业内走红，号称能用极少的视觉信息读懂一整页文档

@HCPTangHY 在 DeepSeek衍生论文：Visual Merit or Linguistic Crutch? A Close Look at DeepSeek-OCR 中发帖

论文地址： 

“学霸”还是“猜题高手”？
DeepSeek-OCR此前因其极高的压缩率和识别准确率在业内走红，号称能用极少的视觉信息读懂一整页文档。然而，论文却提出了一个尖锐的问题：AI是真的看清了字，还是在靠语言逻辑“瞎猜”？ 
为了验证这一点，研究人员给AI安排了一场特殊的“乱码考试”： 

逻辑题： 当给AI看有逻辑的英文句子时，它表现得像个学霸，准确率接近90%。
乱码题： 当研究员故意打乱单词顺序，或者把字母换成毫无意义的随机字符时，DeepSeek-OCR瞬间“原形毕露”，准确率从90%直接暴跌到20%左右。

结论十分扎实： 这种模型高度依赖“语言拐杖”。它不是看清了每一个字，而是根据上下文的概率在猜。比如看到“DeepS___”，它会毫不犹豫地补全为“DeepSeek”，哪怕图片里印的其实是别的词。 
“8.5k悬崖”：压缩不是无限的
研究团队还发现了一个有趣的现象——“...