董卓 (@PikachuGits)用V100 做发票识别有没有什么好的解决方案 中发帖

当前公司收进来两张 32G v100 的卡, 我跑了个Qwen/Qwen3-VL-4B-Instruct 模型, 现在识别发票和完税证明大概在 5 秒左右, 做了 VLLM 推理加速, 请问有什么方式还能提速么. 或者有什么更好的模型