@xstongxue现代OCR工具《XS-VLM-OCR》,新版本 中发帖

1.0.0版本:我开源了一个智能OCR工具:“不止于识别,更懂内容” - 资源荟萃 - LINUX DO 

项目主页:GitHub - xstongxue/XS-VLM-OCR: XS-VLM-OCR:大模型时代的OCR工具🚀
问题反馈:GitHub · Where software is built
讨论交流:https://github.com/xstongxue/XS-VLM-OCR/discussions

版本更新:

v1.0.0

增加了全局快捷键截图功能(ALT+A)。
支持多个大模型(Qwen、GLM、Paddle、Tesseract)。
智能提示词管理系统,包括识别、翻译、解答、整理四个模块。
UI现代化,支持主题切换和侧边栏折叠。
提供历史记录管理和异步任务处理。


v1.1.0

新增模型支持:谷歌、混元、豆包、硅基流动、Ollama系列等。
新增功能:批量图片...