MuShang (@York_Ji) 在 NousResearch 发布 Hermes-4 系列混和推理模型,被设计为几乎不拒答的LLM,通过左右脑互搏做对了小数比较问题 中发帖
2025年8月26日,Nous Research 在 Hugging Face 上上传了 Hermes-4 模型权重,并同步发布了技术报告
据官方文档称,Hermers 的核心亮点在于其低拒绝率。Nous 为此设计了一个新的评估标准(RefusalBench),来测试 LLM 在各种场景下帮助用户的意愿,可以认为评分越高的模型,其对输出的审查更加宽松,具体的评估结果如下
[image]
Hermers-4 在该场景下评分领先,代表着其在大多场景下都不会拒绝回答用户的问题(而且发现grok的道德感也是不出意料的够低)
目前该模型已经上架 Openrouter,输出/输出价格分别为百万token 0.2$/0.8$,并且可以在 Nous Research 官网进行体验
Nous Chat
以下是个人对 Hermes-4-405B 的体验详情(这个官网页面很难用而且打开后GPU温度...