@Diffuser 在 有没有非常快的思考模型 中发帖
公司业务主要是翻译和文案优化,要求接口响应速度在3s内。测了一圈国内的模型一个比一个慢,rpm还很低。最后测了openrouter的gpt-oss-120b速度完全够了,就是质量差点意思,还有没有其他选择?
公司业务主要是翻译和文案优化,要求接口响应速度在3s内。测了一圈国内的模型一个比一个慢,rpm还很低。最后测了openrouter的gpt-oss-120b速度完全够了,就是质量差点意思,还有没有其他选择?