York Ji 在【思考】混合推理模型的缺陷？Gemini 2.5Flash 的推理效率竟然远远低于其他思考模型！中发帖最近看到佬友总结的各个推理模型的API调用价格输入价格输出价格模型名称0.10 美元0.40 美元Gemini-2.0-Flash-Thinking-Exp-01210.30 美元0.50 美元Grok-3-mini0.13 美元0.54 美元QWQ-32B0.15 美元3.50 美元Gemini-2.5-Flash-Preview-04171.10 美元4.44 美元o4-mini1.10 美元4.44 美元o3-mini现在我们将大语言模型相同token数量的输出价格除以输入价格定义为推理成本比，每个模型的推理成本比分别为 Gemini-2.0-Flash-Thinking-Exp-0121: 4.00 Grok-3-mini: 1.67 QWQ-32B: 4.15 Gemini-2.5-F...

York Ji 在【思考】混合推理模型的缺陷？Gemini 2.5Flash 的推理效率竟然远远低于其他思考模型！中发帖

最近看到佬友总结的各个推理模型的API调用价格 




输入价格
输出价格
模型名称




0.10 美元
0.40 美元
Gemini-2.0-Flash-Thinking-Exp-0121


0.30 美元
0.50 美元
Grok-3-mini


0.13 美元
0.54 美元
QWQ-32B


0.15 美元
3.50 美元
Gemini-2.5-Flash-Preview-0417


1.10 美元
4.44 美元
o4-mini


1.10 美元
4.44 美元
o3-mini



现在我们将大语言模型相同token数量的输出价格除以输入价格定义为推理成本比，每个模型的推理成本比分别为 
Gemini-2.0-Flash-Thinking-Exp-0121: 4.00 
Grok-3-mini: 1.67 
QWQ-32B: 4.15 
Gemini-2.5-F...