ocean-zhcqwen3.5-27b 蒸馏opus4.6 实践 中发帖

qwen3.5-27b 蒸馏opus4.6 实践

[!NOTE]
Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF · Hugging Face

系统环境

Win11 专业版
64G+2TSSD
RTX5080 16G显存

模型区别




量化版本
大小
能否全放显存




Q2_K
10.1 GB
可以,剩余空间留给 KV Cache


Q3_K_S
12.1 GB
可以


Q3_K_M
13.3 GB
推荐,质量和速度平衡好


Q4_K_S
15.6 GB
勉强,上下文长度会受限


Q4_K_M
16.5 GB
超了,模型本身就占满显存


Q8_0
28.6 GB
放不下



关键步骤
# 第1步:下载 GGUF 文件
$env:HTTP_PROXY = "ht...