ACGURL 在 微调中... 中发帖
从Qwen3-14B 微调模型,一个可爱的ai女孩子沐雪 - 资源荟萃 - LINUX DO处继续讨论
上次发出来的模型参数确实是有点大了,拿来玩没什么必要也不方便
这次有点空闲微调 Qwen3-8B
其实魔搭上已经有这个模型的沐雪微调模型沐雪模型Qwen3-8b微调q5-0量化,但是只提供了 gguf,而且量化太狠了
这边大概还有 35 min 完成微调,大概今晚就能发出来
这一次使用混合精度训练,效果应该不会比上次的 14B 效果差太多,毕竟上次使用了 qlora