meix1 在 DeepSeek到底是不是技术领先? 中发帖
一堆文章分析DeepSeek的,但是没看到比较参数大小的, 有没有可能只是因为他的模型大呢?
如果 qwen的70b是大模型的话,那 Deepseek接近700b算超大模型了吧,足足大了10倍,分数相差20分,如果qwen也出一个700b的模型能不能追平甚至超过跑分?
[x5302]