wu (@zeyue) 在 pdf识图提取格式化输出的一些问题 中发帖
需求:提取一些电费单pdf上面特定的某些数值,返回json
思路:将pdf发给大模型api来识图提取,使用提示词限定提取的值。
问题:
1、gemini-2.5-pro识图很慢,但是其他家模型感觉不是很好用,不能格式化返回。
2、技术栈使用flask感觉很臃肿,不舒服,不知道这类简单的web应用一般用什么。
3、目前用特价中转返回数据,不贵但是只能用gemini接口,不太会用openai sdk格式化返回。
4、目前识图最好用的模型不知道有哪些