@HarryPeter 在 求助:如何提高api调用视觉大模型的速度 中发帖
各位佬友,我想问一下如何提高像类似于千问视觉大模型的api调用速度,并且质量不会损失太多(大概5%)。当前调用场景主要是批量处理这块,速度瓶颈大概是模型推理慢,希望达到的效果是处理一帧图片大概1s以内。感谢各位佬友的回答!