@sparklydream 在 DeepSeek 新模型还是有点菜啊 中发帖
刚才测了个题,两次都没过扔了个暴力给我。
作为对比,
k2.5 thinking 一遍过
GPT-5.2 Standard Thinking 一遍过
Gemini 3.0 Flash Thinking 两遍过
如果按照传言一个 ~200B 一个 1.5T 来看,还是期待一下 1.5T 吧。