潇洒 (@wuxiao2020)关于大模型响应速度的问题 中发帖

我们项目目前是调用了产商提供的Qwen32B的大模型,用于做工单内容的一些语法、错别字等的纠错,目前用户使用下来反馈效果还行,但是就是慢,需要提升速度。 
产商反馈说是提示词写的不好,我们的提示词是比较简单的就是让大模型纠正语法错误和错误字。
想咨询下佬友们,像这种情况,对于这种推理大模型想提升速度,光改提示词解决不了根本问题吧,是否让对方产商提升算力还是说有什么好的方案?