𝑨𝑪𝑮𝑼𝑹𝑳 (@acgurl) 在 微调中…(Muice-Hunyuan-7B-Instruct) 中发帖
从来和沐雪一起聊天~ [基于 Qwen3-8B 微调 ]处继续讨论
Qwen3-8B 的上下文有点小,感觉拿来角色扮演会很不够用
Hunyuan-7B-Instruct 有原生 256K 上下文,同时参数更小一点的同时中文能力很接近,数学能力甚至更高一点,因此这次用这个微调试试
大概 1h 后就会完成