此茶无苦(麦门永存) (@Betterlove) 在 DeepSeek v4，让我失望了(转发所见文章) 中发帖DeepSeek v4好不好，到底有多好，和同行对比如何？一眼就能看出来

此茶无苦(麦门永存) (@Betterlove) 在 DeepSeek v4，让我失望了(转发所见文章) 中发帖

DeepSeek v4好不好，到底有多好，和同行对比如何？一眼就能看出来。 
连接不同大模型，给aipy任务提示词： 
打开windows画图软件，控制鼠标，画一辆小汽车。接下来看图回答问题：谁的最丑？谁的最抽象？国外谁最好？国内谁最好？DeepSeek进步如何？谁进步最大？ 
答对有奖！ 
 [IMG_2998] 
DeepSeek v4 Flash和 v3.2进步并不大，更抽象的是Pro比Flash差，收获了长记忆，失去了部分通识。 
GLM5.1和Sonnet并列第一 
GPT5.2也不行。QWen3.6本来不错，但出现了幻觉。 
再看各家，为什么各家差异这么大？因为大模型能力取决于：训练数据大小，综合性，对世界通识的认知能力这需要数据成本、数据清晰成本训练显卡成本、耗电成本 
能力和成本成正比，而任何企业都要算投入产出比，找均衡 
因此很多大模型，是对某些方面擅长，损失通识，获得打...