luckfu我量化了一个适用于华为 ascend 910b下mindie推理框架的deepseek R1 的w8a8模型 中发帖

免去 fp8->bf16->w8a8之苦,部署需要两台910b 64G一体机