@sparklydream 在 DeepSeek 新模型还是有点菜啊中发帖刚才测了个题，两次都没过扔了个暴力给我

@sparklydream 在 DeepSeek 新模型还是有点菜啊中发帖

刚才测了个题，两次都没过扔了个暴力给我。 
作为对比， 

k2.5 thinking 一遍过
GPT-5.2 Standard Thinking 一遍过
Gemini 3.0 Flash Thinking 两遍过

如果按照传言一个 ~200B 一个 1.5T 来看，还是期待一下 1.5T 吧。