ocean-zhc 在 qwen3.5-27b 蒸馏opus4.6 实践 中发帖
qwen3.5-27b 蒸馏opus4.6 实践
[!NOTE]
Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-GGUF · Hugging Face
系统环境
Win11 专业版
64G+2TSSD
RTX5080 16G显存
模型区别
量化版本
大小
能否全放显存
Q2_K
10.1 GB
✅ 可以,剩余空间留给 KV Cache
Q3_K_S
12.1 GB
✅ 可以
Q3_K_M
13.3 GB
✅ 推荐,质量和速度平衡好
Q4_K_S
15.6 GB
⚠ 勉强,上下文长度会受限
Q4_K_M
16.5 GB
❌ 超了,模型本身就占满显存
Q8_0
28.6 GB
❌ 放不下
关键步骤
# 第1步:下载 GGUF 文件
$env:HTTP_PROXY = "ht...