Grogu (@yqyan)阿里云发布通义千问蒸馏小模型的升级:DistilQwen2.5 中发帖

DistilQwen2.5 是阿里云推出的轻量化大语言模型系列,通过双层蒸馏框架、数据优化策略和参数融合技术,在显著降低计算资源需求的同时,提升了模型性能。 
[Score]
模型输出案例
[示例一:知识性问题]
[示例二:知识性问题]
[示例三:逻辑推理类问题]

DistilQwen2.5-0.5B-Instruct
DistilQwen2.5-1.5B-Instruct
DistilQwen2.5-3B-Instruct
DistilQwen2.5-7B-Instruct