虹 连 (@user924)中文OCR哪家强?(手写评测来了!)【系列评测二】 中发帖

中文 OCR 评测第二弹!本次将对呼声较大的 中文手写场景OCR 进行评测。
前情回顾:中文OCR哪家强?【系列评测一】

测评说明

总结果:
[中文手写评测(23样本)202505]



新出不久的豆包1.5视觉模型(Seed1.5-VL)令人满意,夺得头筹,对得起其自己宣称的能力表现。


紧随其后的是 Qwen VL Max 模型,不负 MAX 之名,表现良好;开源版2.5-72B稍逊,但这个成绩应该算目前开源最强了;低成本的7B小模型也有不俗的表现,甚至超过了后面的很多大模型。本次还测了Qwen2系列,新的Qwen2.5系列确实在视觉识字方面有了显著进步。


gemini 系列在这里的表现有点让人失望。最强的居然是 gemini-2.0-flash-exp ,接口是 aistudio 官方接口;上期表现亮眼的gemini-2.5-pro-preview(openro...