xixi_hu有人知道nvfp4这种量化格式该怎么改吗? 中发帖

我是50系显卡,听说了nvfp4格式的量化模型能最大程度上利用显卡的算力,想尝试一下,但是在魔塔跟huggingface都没有找到现成的模型,想自己量化又不知道该怎么做,问大模型也是各说各的方式