York Ji 在 【思考】混合推理模型的缺陷?Gemini 2.5Flash 的推理效率竟然远远低于其他思考模型! 中发帖
最近看到佬友总结的各个推理模型的API调用价格
输入价格
输出价格
模型名称
0.10 美元
0.40 美元
Gemini-2.0-Flash-Thinking-Exp-0121
0.30 美元
0.50 美元
Grok-3-mini
0.13 美元
0.54 美元
QWQ-32B
0.15 美元
3.50 美元
Gemini-2.5-Flash-Preview-0417
1.10 美元
4.44 美元
o4-mini
1.10 美元
4.44 美元
o3-mini
现在我们将大语言模型相同token数量的输出价格除以输入价格定义为推理成本比,每个模型的推理成本比分别为
Gemini-2.0-Flash-Thinking-Exp-0121: 4.00
Grok-3-mini: 1.67
QWQ-32B: 4.15
Gemini-2.5-F...