@dwqxq1 在 【大模型系列33】关于Deepseek 4,你想知道的一切 中发帖
基本资料
官方模型卡:DeepSeek_V4.pdf · deepseek-ai/DeepSeek-V4-Pro at main
deepseek-4-pro
输入¥12,输出¥24,缓存1/12
上下文1m,最大输出384k
参数1600B,激活49B,参考3.2是685B
预训练数据33T,预训练数据33T,截止日期25年5月
训练平台:华为升腾
deepseek-4-flash
输入¥1,输入¥2,缓存1/5
上下文1m,最大输出384k
参数184T,激活49B
训练同上
官方自评
[image]
AMArena暂未上线
ArtificialAnalysis暂未上线
LiveBench暂未上线
Chat渠道
官网已上线
OpenRouter暂未上线
LMArena暂未上线
本地部署
模型下载:DeepSeek-V4 - a deepseek-ai Colle...