六一家 (@jerric_liu) 在 Deepseek R1 训练分析 中发帖
看了下这个R1模型的完整分析,写的非常好,推荐各位佬友,本来meduium是要收费的,有了free linkdrawing-deepseek-r1-architecture-and-training-process-from-scratch
截了几张图可以看看
[image]
[image]