@Clarence如何 AI 识图响应速度? 中发帖

现在有个功能是上传图片让 AI 提取其中的文字信息,转换成数据库中对应的表结构写入库里。为了防止数据有问题,先返回初步数据,人工确认后写库。问题就出在这个初步数据返回接口时间太长了,最长能达到几十秒,一开始是用 kimi-k2.5 直接识图返回结构化数据,现在改成两段式,先 OCR 提取纯文本,再喂给响应比较快的 AI 返回结构化数据,文本清洗,调整提示词等等,最快响应还是要达到 10s,目前用的模型是PaddlePaddle/PaddleOCR-VL-1.5加Qwen3.5-Flash,佬友们有什么建议呢?