皮皮不太皮 (@join2) 在腾讯混元发布OCR模型，仅1B参数中发帖腾讯混元于 11月 25日宣布推出开源 OCR模型HunyuanOCR，该模型参数量为1B，基于混元原生多模态架构构建，在多项OCR应用评测中取得当前最优效果

皮皮不太皮 (@join2) 在腾讯混元发布OCR模型，仅1B参数中发帖

腾讯混元于 11月 25日宣布推出开源 OCR模型HunyuanOCR，该模型参数量为1B，基于混元原生多模态架构构建，在多项OCR应用评测中取得当前最优效果。这款模型采用端到端训练推理范式，通过单次前向推理即可完成多项任务，相比传统级联方案更具效率优势。其架构由原生分辨率视频编码器、自适应视觉适配器与轻量化语言模型三部分组成。性能方面，HunyuanOCR在复杂文档解析评测OmniDocBench中获得94.1分，超过谷歌 Gemini3-pro 等模型；在涵盖文档、街景、手写等九大场景的测试集上，其文字检测与识别能力领先同类开源及商业模型。各家OCR也开始LLM了