仿生人会梦见电子羊吗 (@erosminer) 在 有无性价比更高的图片文字提取方案 中发帖
我现在大概是有这么个需求,手头大概每天会收到3000+手机拍摄的照片,照片中包含该材料的名称等信息。大概长下面这样:
[2025_06_03_14_41_IMG_6619]
我想找个方案实现批量提取图片中的文字对照片进行批量重命名。目前尝试了下面两种方案:
使用OCRtesseract对照片进行文字提取
用火山的SDK调用doubao-1.5-vision-pro-250328对照片中的文字进行提取
▶
方案2代码
目前的结果是方案1没成功,方案2成功了但是调用火山的api,3000张就花了5块钱左右。
[图片]
不知道有没有佬友了解相关方面的技术,可以的话想找个性价比更高的方案,目前预计至少还有10w+的照片。