ZinGer_KyoN关于Qwen3我有一个猜想, 不一定对 中发帖

235B-A22B可能是临发布才赶鸭子上架的, 或者说是被逼得至少要有一个分数上接近SOTA的模型面子上才过的去, 32B/14B这些小模型才是他们花精力认真调的, 在这种小参数下有明显提升