阿钖 (@aayang) 在 Deepseek App上新模型了。 中发帖
[Screenshot_20260211_185852]
知识库更新到2025/5,正好我就拿2025/6的高考题考考祂。
[Screenshot_20260211_190010]
经过683秒的思考,作答如下:
[Screenshot_2026_0211_191812]
请我们的哈基米3Pro老师来批改一下:
[Screenshot_2026_0211_192330]
拿到了满分好成绩。
再看看opus4.6think老师呢?
[Screenshot_2026_0211_192907]
同样满分!
作为对比,我们来测试一下调用成本相近的哈基米3flash,看看祂能得几分?
[Screenshot_2026_0211_193614]
3Pro老师同样给到满分。但是我在第一次调用时答案是错误的。祂答到一半自己发现,然后就截断了。很诡异。同时,哈基米3flash的答...