arch 在 GLM-OCR发布了 中发帖
GLM-OCR发布了,参数量控制在0.9B。
现在的趋势是OCR模型越来越轻量化。虽然不到1B,但官方给的数据在公式识别、表格还原和信息提取上都是SOTA级别。
这意味着在普通服务器甚至端侧设备上,也能跑得动高精度的文档结构化任务。对于算力有限但又需要处理复杂PDF的场景(比如发票、论文),这个小模型是个不错的补充。
权重已上 Hugging Face。
[image]
Weights: zai-org/GLM-OCR · Hugging Face
Try it: http://ocr.z.ai
API: GLM-OCR - Overview - Z.AI DEVELOPER DOCUMENT