bluish 在 当前最具api性价比的模型是什么 中发帖
我现在有一个ocr项目,先是将pdf通过azure ocr提取出了表格结构及单元格。
但很多格的置信度太低了,考虑引用LLM修正(输入行列文本,标注低置信度格,要求建议)。
请问佬们这个思路正确吗?当然也在考虑输入表格截图,但貌似引入截图让LLM结果更不保守了。
此外,如果用LLM的话,哪个模型api是性价比推荐呢?我现在用gemini 2.5 flash。