cocw (@ccwgoto)dsv3.2 exp 发布,目测降成本,能力不变 | 慢讯 中发帖

从 DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价 继续讨论 
根据官方给出的评分
[image]
(图片来自魔搭社区dsv3.2开源仓库)
和 v3.1 terminus 基本齐平,但是降低了成本

DeepSeek 稀疏注意力机制(DSA)首次实现了细粒度的稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长上下文训练和推理效率。

有益于用户的是 输入 -50%,输出 -75% 的 API 价格下调
[image]
(图片来自 ds 微信公众号)

[!success]
好一个降本增效:tieba_003: