BitByte 在 什么是满血版R1, 解释解释,翻译翻译,理想与现实 差别不一般大 中发帖
1️⃣理想的满血版R1:
|---- 模型参数(671B)
|---- 精度(BF16/FP8)
|---- 上下文窗口大小(128K)
|---- 深度思考(COT)窗口大小(32K)
|---- 输出窗口大小(8K)
2️⃣ 实际第三方提供的满血R1:
|---- 模型参数(671B)
|---- 精度(Q8/Q4/Q1.5)
|---- 上下文窗口大小(64K/32K)
|---- 深度思考(COT)窗口大小(2K-8K)
|---- 输出窗口大小(4K-8K)
也就是说,所谓的「满血」是指 模型参数规模 的「满血」。