eve2333 在 Abliteration到Heretic 中发帖
看见最近有人发帖说什么魔改版qwen3.5 -9b,发现是huggingface里面的Abliteration版本,想起来最近拿ai汉化漫画的过程;本人在个人电脑上部署过qwen3 30B-A3B的Abliteration版本(Q6)和qwen3.5的35b-a3b Heretic 版本(Q6)
大模型的安全性一直是从gpt4火爆以来老生畅谈的问题,包括Claude母公司Anthropic的公司宗旨也是几家大模型公司里面最贴合安全的,从2025.1deepseek爆火,人们越来越多的走进大模型世界,我当时用的是deepseek的huihui模型,他使用abliteration来破线;
Abliteration
Abliteration在机器学习领域,这种模型内部技术具体方法是“切除”或“禁用”模型的某个部分(例如负责拒绝的神经元、注意力头或一层网络),然后模型性能变化该部分的功能。
H...