@HCPTangHYDeepSeek发布DSpark推测解码框架,DeepSeek-V4单用户生成速度提升60%–85% 中发帖

DeepSeek-AI与北京大学联合发布了DSpark,一个面向大语言模型推理加速的推测解码框架。该框架已部署于DeepSeek-V4的线上服务系统,与此前的生产基线MTP-1相比,在相同吞吐量水平下将单用户生成速度提升了60%–85%(V4-Flash)和57%–78%(V4-Pro)。团队同步开源了DSpark模型权重及配套训练仓库DeepSpec。 


[image]
[image]