逗号 (@Dao_er)【纯干货】大模型选型全拆解:型号、架构、量化、上下文,一次讲清 中发帖

做了两年的AI应用开发,积累了一些大模型选型的经验,跟大家分享一下 
选型之前,先科普一下大模型型号上的核心参数:
1. 模型系列及版本号
Qwen3: 模型系列,Qwen系列模型的第三代。
2. 模型架构或类型
VL:Vision-Language(视觉-语言) ,表示该模型支持多模态(如图像+文本)任务。
o:omni(全模态),例如GPT-4o、Qwen3-Omni,标识该模型支持全模态(一般包括文本、图像和音频)任务。
MoE :Mixture of Experts(专家混合) ,表示该模型使用了MoE架构,实际可以理解为内部放置了多个小模型,收到任务时,会在内部进行路由,找到对应领域模型再执行任务。
3. 模型参数规模
30B:Billion(十亿),表示模型拥有300亿个参数(权重),一般来说,参数量越大,模型“脑容量”越大,理论上能力也越强
A * B:Acti...