max (@Limitee)腾讯发布WeDLM-8B-Instruct扩散模型 中发帖

Tencent刚刚发布了新的扩散小模型 模型仓库:tencent/WeDLM-8B-Instruct · Hugging Face 


WeDLM-8B-Instruct
WeDLM-8B-Instruct 是我们的旗舰级指令微调扩散语言模型(Diffusion Language Model),它在标准因果注意力(Standard Causal Attention)机制下执行并行解码,基于 WeDLM-8B 微调而成。
亮点:

🚀 在数学推理任务上,速度比经过 vLLM 优化的 Qwen3-8B 快 3-6 倍
📈 在大多数基准测试中,性能优于基础的 Qwen3-8B-Instruct
原生兼容 KV 缓存(支持 FlashAttention, PagedAttention, CUDA Graphs)

关于基础(预训练)版本,请参阅 WeDLM-8B。
📄 论文 (即...