青草蛋糕 (@gloryplove6) 在 PaddleOCR-VL部署使用体验记录 中发帖
前言
前阵子看到paddle发布SOTA的OCR模型,预览效果很nb,但看很少人去尝试使用。刚好公司有一些书籍类型的pdf(含公式,图片,表格等),内容双栏显示。使用场景够复杂了吧,也是日常会遇到的情况。于是就开始折腾部署PaddleOCR-VL模型。
配置
RTX6000(46G显存)
Windows11(配置wsl,Ubuntu-22.04)
python==3.12
确保wsl内的CUDA 版本必须大于或等于 12.6(nvidia-smi查看)
开始操作
所有流程都在wsl中操作,包括python虚拟环境创建包安装等。我使用非Docker的方式安装
1.创建虚拟环境
conda create -n paddleocr python==3.12
2.安装paddle包
# 以下命令安装 CUDA 12.6 版本的 PaddlePaddle,对于其他 CUDA 版本以及 C...