鸦羽 (@Raven95676) 在 不止天气卡片,DeepSeek V4实战测试 中发帖
前言
备受期待的DeepSeek V4终于发布了,相信很多人都想要看到这个模型在Coding任务中的实际表现。按传统来说,我们应该跑一个天气卡片,但是我一直觉得只有天气卡片完全反映不出来模型真正的能力,于是我决定来点创新的实战测试。
为保证本测试接近实际使用场景,测试全程使用Claude Code v2.1.86,官方正价API,模型映射配置如下所示:
[图片]
[!NOTE]
本次测试中DeepSeek V4所编写的源码可在 Raven95676/ds_v4_test: DeepSeek V4 Test - Codeberg.org 获取。真实环境测试仅保留Diff文件。
由于时间以及精力还有财力限制,测试可能片面,欢迎各位补充测试用例。
综上,让我们开始测试吧!
希望测完了我不会变成负翁
独立项目从零生成测试
很多情况下,我们有了灵感都会让AI来开荒。我们首先...