林黛玉倒拔垂杨柳 (@Qiner)🔥【实践向】(๑•̀ㅂ•́)و✧ 用 Document AI 成功转录 403 页纯图扫描 PDF! 中发帖

(\ _ /) 
( ・-・)
/っ 就是,GCP 有个专门解析文档的 Document AI
概览 – Document AI – Google Cloud Console
[image]
不止是 PDF,还有专门解析表格能记住空间位置的那些 (还没用过)
然后刷到佬友有个 30 年前的纯 PDF 扫描件,原件
https://linux.do/t/topic/453425/11
于是试试。

不是教程贴,因为我也是第一次弄这玩意,我也不知道都特么修改了什么配置。Windows 7 很多不兼容了卡 BUG 装了一堆限 Windows 10 才能装的 Python 结果卸载不了差点把系统搞死。
最后发现坑是 grpcio Windows 7 只能兼容到 1.50.0 版本 tnnd。

水这贴的意义不是喂鱼,而是想说这条路、走得通。
原书 ↓
[i...