𝑨𝑪𝑮𝑼𝑹𝑳 (@acgurl) 在来和沐雪一起聊天~ [基于 Hunyuan-7B 微调 ] 中发帖沐雪Roleplay Hunyuan-7B-Instruct 微调模型从来和沐雪一起聊天~ [基于 Qwen3-8B 微调]处继续上次的 Qwen3-8B 的速度是有了，但是其实调得不怎么精细这次换用 Hunyuan-7B 模型，微调 5 个 epoch，最后一次 loss 已经到了 0.20 而且这个模型原生支持 256K 上下文，用起来还是很舒服的（创空间算力有限，上限 8192）目前沐雪的数据集以及大部分微调模型都在这里了沐雪，感兴趣的佬友可自行查看 [image]

𝑨𝑪𝑮𝑼𝑹𝑳 (@acgurl) 在来和沐雪一起聊天~ [基于 Hunyuan-7B 微调 ] 中发帖

沐雪Roleplay Hunyuan-7B-Instruct 微调模型 
从来和沐雪一起聊天~ [基于 Qwen3-8B 微调]处继续 
上次的 Qwen3-8B 的速度是有了，但是其实调得不怎么精细 
这次换用 Hunyuan-7B 模型，微调 5 个 epoch，最后一次 loss 已经到了 0.20 
而且这个模型原生支持 256K 上下文，用起来还是很舒服的（创空间算力有限，上限 8192） 
目前沐雪的数据集以及大部分微调模型都在这里了 沐雪，感兴趣的佬友可自行查看 
 [image]