@HCPTangHYDeepSeek更新底层算子库DeepGEMM,基本确认实装mHC和下一代硬件支持 中发帖

刚刚, DeepSeek对其开源矩阵乘法加速库DeepGEMM进行了重大代码提交。本次更新的核心实质在于正式接入了最新的网络架构组件流形约束超连接(mHC),并在此基础上提前实现了对英伟达下一代Blackwell(SM100)架构及FP4极低精度计算的底层支持。 

[image]