🄸🅹🄽🅴🄳 (@sonicviking) 在 DeepSeek-OCR 2重磅发布:AI学会“人类视觉逻辑”,以因果流解读图片 中发帖
DeepSeek发布OCR 2新系统,凭借DeepEncoder V2核心技术,让AI学会像人类一样按“逻辑因果”看图,而非机械扫描。在基准测试中,新模型达到91.09%的性能,较前代提升3.73%,同时视觉token使用上限降至1120个(前代为1156个)。这一技术突破或将颠覆传统文档处理模式,开启原生多模态推理新路径。
看着挺厉害的,但提升3.73%这个算多吗