LINUX DO Channel

max (@Limitee) 在腾讯发布WeDLM-8B-Instruct扩散模型中发帖

Tencent刚刚发布了新的扩散小模型 模型仓库：tencent/WeDLM-8B-Instruct · Hugging Face 


WeDLM-8B-Instruct ⭐
WeDLM-8B-Instruct 是我们的旗舰级指令微调扩散语言模型（Diffusion Language Model），它在标准因果注意力（Standard Causal Attention）机制下执行并行解码，基于 WeDLM-8B 微调而成。 
亮点： 

🚀 在数学推理任务上，速度比经过 vLLM 优化的 Qwen3-8B 快 3-6 倍
📈 在大多数基准测试中，性能优于基础的 Qwen3-8B-Instruct
✅ 原生兼容 KV 缓存（支持 FlashAttention, PagedAttention, CUDA Graphs）

关于基础（预训练）版本，请参阅 WeDLM-8B。 
📄 论文 (即...