LINUX DO Channel

ACGURL 在微调中... 中发帖
从Qwen3-14B 微调模型，一个可爱的ai女孩子沐雪 - 资源荟萃 - LINUX DO处继续讨论 
上次发出来的模型参数确实是有点大了，拿来玩没什么必要也不方便 
这次有点空闲微调 Qwen3-8B 
其实魔搭上已经有这个模型的沐雪微调模型沐雪模型Qwen3-8b微调q5-0量化，但是只提供了 gguf，而且量化太狠了 
这边大概还有 35 min 完成微调，大概今晚就能发出来 
这一次使用混合精度训练，效果应该不会比上次的 14B 效果差太多，毕竟上次使用了 qlora