@HCPTangHYGLM-4.7-Flash获评100B参数以下最智能开源模型 中发帖

Artificial Analysis竞技场发布最新情报指数,智谱旗下的GLM-4.7-Flash以30分的成绩,正式成为该指数中总参数量低于100B的最强开源模型。该模型凭借 31B 的总参数量与 3B 的活跃参数量,成功在单块 NVIDIA H100 显卡上实现了原生 BF16 精度运行,展现了极高的参数效率。 
在核心能力表现上,GLM-4.7-Flash在代理能力方面表现优异。其在 τ²-Bench Telecom 基准测试中取得了约 99% 的高分,刷新了包括前沿旗舰模型在内的所有评估纪录。这意味着该模型在处理现实世界的复杂工作任务,如准备演示文稿、终端操作及网络访问分析时,能够以较小的体量提供与大型旗舰模型相媲美的执行力。


评测也指出了该模型的弱点。GLM-4.7-Flash在知识库和前沿推理方面较弱。在衡量模型知识量与幻觉率的 Omniscience 指数中,该模型得分...