Bunn (@BunnHack) 在 Dubesor LLM Benchmark出了GPT 5的排行 中发帖
[image-3]
测试了 GPT-5 系列:
Nano:
极其冗长的思考者,完成响应的速度比 GPT-5 Chat 慢五倍以上,或者比 GPT-5 mini 慢一半。
在能力方面,它的表现大约与 Gemini 2.5 Flash Lite 持平,但成本是其 4 倍,速度慢 11 倍。
它要么需要大幅削减推理能力(牺牲能力),要么价格至少降低 10 倍才能勉强可行。
Mini:
思考更简洁。
非常出色的小型模型,能力大约相当于 o4-mini-high 或 Llama 3 405B。
Chat:
这是 ChatGPT 中使用的模型。不具备思考能力,尽管文档声称它支持推理令牌,但我未能让它在任何响应中产生任何推理。
非常健谈,略微更宽容。默认个性是每个回复都以一个强制性的后续问题结束。我发现它的整体风格有点烦人(主观/未评分)。
在代码任务中,表现出一些懒惰,有时会...