@SugarBreeze 在 Nous Research发布Hermes4系列模型 中发帖
基于Llama3 70B和405B后训练的混合推理模型,按官方说主要特色为没有公司强加的伦理道德,在争议话题上的拒绝率要更低,并且角色扮演和创意性写作的表现也更好
HuggingFace:
官方对话网页:
[t_HvRYPEHV0pc8iS2zHHn]
思考模式下在 RefusalBench 上第一,非思考模式仅次于Grok4
[Screenshot_2025-08-27-20-17-22-979_com.android.chrome-edit]
不过智力跑分和其他开源模型的平均分对比就很会玩