此茶无苦(麦门永存) (@Betterlove)DeepSeek v4,让我失望了(转发所见文章) 中发帖

DeepSeek v4好不好,到底有多好,和同行对比如何?一眼就能看出来。 
连接不同大模型,给aipy任务提示词:
打开windows画图软件,控制鼠标,画一辆小汽车。接下来看图回答问题:谁的最丑?谁的最抽象?国外谁最好?国内谁最好?DeepSeek进步如何?谁进步最大?
答对有奖!
[IMG_2998]
DeepSeek v4 Flash和 v3.2进步并不大,更抽象的是Pro比Flash差,收获了长记忆,失去了部分通识。
GLM5.1和Sonnet并列第一
GPT5.2也不行。QWen3.6本来不错,但出现了幻觉。
再看各家,为什么各家差异这么大?因为大模型能力取决于:训练数据大小,综合性,对世界通识的认知能力这需要数据成本、数据清晰成本训练显卡成本、耗电成本
能力和成本成正比,而任何企业都要算投入产出比,找均衡
因此很多大模型,是对某些方面擅长,损失通识,获得打...