CyDione解决vllm推理QwQ-32B在OpenWebUI无法正确折叠思考过程的问题 中发帖

蒸馏的deepseek-R1-32b-gguf及用vllm也有同样的问题,应该也适用吧 
第一步:vllm命令中加入**–enable-reasoning --reasoning-parser deepseek_r1**
第二步:openwebui添加 @he0119的函数https://openwebui.com/f/he0119/reasoning并开启全局
[image]
over