York Ji【思考】混合推理模型的缺陷?Gemini 2.5Flash 的推理效率竟然远远低于其他思考模型! 中发帖

最近看到佬友总结的各个推理模型的API调用价格 




输入价格
输出价格
模型名称




0.10 美元
0.40 美元
Gemini-2.0-Flash-Thinking-Exp-0121


0.30 美元
0.50 美元
Grok-3-mini


0.13 美元
0.54 美元
QWQ-32B


0.15 美元
3.50 美元
Gemini-2.5-Flash-Preview-0417


1.10 美元
4.44 美元
o4-mini


1.10 美元
4.44 美元
o3-mini



现在我们将大语言模型相同token数量的输出价格除以输入价格定义为推理成本比,每个模型的推理成本比分别为
Gemini-2.0-Flash-Thinking-Exp-0121: 4.00
Grok-3-mini: 1.67
QWQ-32B: 4.15
Gemini-2.5-F...