@SmallMain记一次对 Claude Fable 5、Opus 4.8、Minimax M3、Xiaomi Mimo V2.5 系列、Hy3、Qwen3.7 系列的真实项目需求的横向评测(榜首更迭!) 中发帖

由于测试的模型越积越多了,表格会删除一些同厂商的旧模型,你可以在之前的评测帖子里找到它们的成绩。 

项目
这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。
本轮与上两轮评测的项目和环境都完全一致:

第一轮

上一轮

模型来源

Claude 系列模型: 官方 API
Mimo V2.5 系列模型: 官方 Token Plan
Hy3 Preview: 官方 API
Qwen3.7 系列模型: 官方 API
Minimax M3: 官方 API
Nex-N2-Pro: OpenRouter Free API
Nemotron 3 Ultra: OpenRouter Free API

速度




排名
模型
时间(分钟)
备注




1
Grok 4.20 0309 Reasoning
3



2
Step-3....