@ccb 在 关于 Qwen3-Coder,一个重度 Claude 4 用户的非典型评测 中发帖
先说背景:我不是 Claude Code订阅用户,是 API 重度使用者。每个月的账单稳定在四位数($),主要用于一个基于 kilocode 框架的自动化开发流,处理一个历史三年的大型 Vue + TS 项目。我对模型的 latency、上下文理解能力和代码的“工程感”极度敏感。
抱着消磨时间的心态,把我的工作流切到了 Qwen3-Coder。
现在我需要重新评估我的 API 预算腊😢
1. Latency & Throughput
这不是快一点的问题。这是 质变 。用 Claude 4 API,尤其是在长上下文请求后,TTFT (Time To First Token) 的延迟肉眼可见,后续吞吐量也经常让人感觉在“挤牙膏”。
Qwen3-Coder 的 API 响应,体感和敲本地 shell 没差。代码流几乎是瞬间喷涌而出,没有那个熟悉的、让人焦虑的停顿。仅这一点,就足以改变很...