CNM 在 预测一下 DeepSeek 第五天的发布 中发帖
投票
目前的发布
Day 1: FlashMLA (Flash Multi-Layer Attention) - 高性能解码内核
Day 2: DeepEP (Deep Expert Parallelism) - 高性能专家并行通信库
Day 3: DeepGEMM (Deep GEMM Library) - 高性能 FP8 GEMM 库
(Day 3.5: DeepPrice😜 - 官方 API 服务降价)
Day 4: DualPipe - 优化并行策略
我过去的预测
Day 2: Disk Cache, GEMM
Day 3: DeepCache(硬盘缓存), DeepInference(接口服务), DeepPipe(数据管道), DeepTrain(训练框架)
今天预测的分析
总准则:高性能,DeepSeek 真的有且真的用。紧扣 V3 和 R1 的推理或训练。
...