Autsun关于开源国模的一些问题 中发帖

因为最近自己工作上的项目会跑一些开源小规模的模型,比如Qwen 3.6 35BA3B之类的 
我发现主要的显存占用和模型规模大小有关
而国内的模型定价里,比如智谱的GLM-5,5.1,5.2,这三个模型其实都是744B(激活 40B)的moe模型,抛开GLM-5.2的1M上下文会更占用资源,其实5和5.1应该资源消耗是一样的,同理Kimi的K2.5-K2.7也都是1T(激活32B)的moe模型
但是定价却有区别,想知道为什么这些厂商不把早点模型都更新到最新的淘汰掉老的,还把资源留在老的模型上呢,特别是一些第三方渠道(比如腾讯和阿里之前的codingplan都还停留在GLM5,KIMIK2.5,实际上更新到5.1甚至限制256K上下文的5.2和KIMIK2.7并不会增加算力消耗)
难道这些厂商都只是因为不想继续升级模型然后让存量用户自己不续订亏钱的codingplan,不惜把算力都留在...