𝑨𝑪𝑮𝑼𝑹𝑳 (@acgurl)来和沐雪一起聊天~ [基于 Hunyuan-7B 微调 ] 中发帖

沐雪Roleplay Hunyuan-7B-Instruct 微调模型 
从来和沐雪一起聊天~ [基于 Qwen3-8B 微调]处继续
上次的 Qwen3-8B 的速度是有了,但是其实调得不怎么精细
这次换用 Hunyuan-7B 模型,微调 5 个 epoch,最后一次 loss 已经到了 0.20
而且这个模型原生支持 256K 上下文,用起来还是很舒服的(创空间算力有限,上限 8192)
目前沐雪的数据集以及大部分微调模型都在这里了 沐雪,感兴趣的佬友可自行查看
[image]