1990 奇點臨近 (@momomoss01) 在 Multi OCR——可能是目前最棒的 Obsidian OCR插件 中发帖
项目地址:GitHub - qidianlinjin1990/multi-ocr: 一个支持AI OCR和OCR服务商的插件
开发原由是因为常用的yolo暂时不支持多模态,而在Obsidian上发现了两个插件ai-image-ocr和ocr-extractor,所以将二者综合了一下。
主要功能是:
支持添加多个AI OCR供应商和自动抓取所有模型并进行选择,方便添加,自定义提示词,自定义json参数。
支持四大OCR服务商,包括MinerU、TextIn、Paddle OCR-VL和Mistral OCR。支持OCR服务商OCR参数设置
支持Obsidian笔记扫描提取所有可以ocr的文件进行选择,支持本地其他文件夹文件的选择,支持单独粘贴url。
返回的Markdown内容可以返回当前笔记,可以返回其他特定笔记,也可以新建笔记。返回的Markdown内容格式也可以自定义清洗。 ...