看到这提肛20并点赞 (@remoteman) 在建议佬友们降低gpt oss的期待中发帖首先贴上官方的模型卡片地址：注意到架构部分： [image] 可以看到，120B MoE模型激活参数只有5B，20B MoE模型激活参数 3.6B，就目前的大模型技术手段还是难以脱离“力大砖飞”的范畴，所以120B的模型可能在实际使用难以匹敌主流的旗舰模型（早上拉了量化版本感觉确实如此）

看到这提肛20并点赞 (@remoteman) 在建议佬友们降低gpt oss的期待中发帖

首先贴上官方的模型卡片地址： 

注意到架构部分： 
 [image] 
可以看到，120B MoE模型激活参数只有5B，20B MoE模型激活参数 3.6B，就目前的大模型技术手段还是难以脱离“力大砖飞”的范畴，所以120B的模型可能在实际使用难以匹敌主流的旗舰模型（早上拉了量化版本感觉确实如此）。20B模型应该在中小模型中表现不错。