看到这提肛20并点赞 (@remoteman)建议佬友们降低gpt oss的期待 中发帖

首先贴上官方的模型卡片地址: 

注意到架构部分:
[image]
可以看到,120B MoE模型激活参数只有5B,20B MoE模型激活参数 3.6B,就目前的大模型技术手段还是难以脱离“力大砖飞”的范畴,所以120B的模型可能在实际使用难以匹敌主流的旗舰模型(早上拉了量化版本感觉确实如此)。20B模型应该在中小模型中表现不错。