@RyanVan[自开发]基于LLM的公式OCR识别、分析和管理软件 中发帖

基于AI的公式识别、分析与管理软件


一次识别调用三次LLM:

第1次(LaTeX 提取):仅从图片提取 LaTeX 文本。
第2次(智能分析):与第一次并发。基于图片生成标题、简介、变量表、术语表与建议。
第3次(核查与置信度):在第一次调用返回LaTeX后开始。对比“提取到的 LaTeX + 原图”,产出状态(ok/warning/error)、问题列表、覆盖率与 0–100 的置信度。

建议的模型选择与耗时:


Gemini-2.5-flash:综合准确率与速度较优。常见公式约 10s 左右,复杂场景约 20s。


Gemini-2.5-flash-lite:用于轻量场景,在复杂公式上准确性略差。


Gemini-2.5-pro:准确率接近100%,但复杂公式速度很慢。




支持区域截图(默认快捷键 `Ctrl + Shift + A`)或导入本地图片



智...