@gaojjxDeepSeek 3.1使用的FP8真的比FP16效果更好吗 中发帖

DeepSeek新的3.1用的是FP8而不是主流的FP16训练的,是因为FP8是更有优势吗还是只能用国产芯片训练的无奈之举.