Jo174 在 DeepSeek！看看你带出来的兵！中发帖在我开始用mac本地部署大模型之后就热衷于下载各种支持mlx的模型测试能力，期待能找到一个在4bit量化下最好用的模型，本来在Gemma3n无法直接部署的前提下qwen3暂时得此殊荣，但突然发现还有一个deepseek-r1-0528-qwen3-8b，想着两个国产之光强强联手岂不美哉，然而结果却令我有些啼笑皆非首先我对DeepSeek偏抽象的语言风格持中立态度我操，用户真的怒了在DeepSeek的训练下，qwen毫无疑问的完美继承了这一风格，把原本的严肃抛在脑后，可惜马上更抽象的就来了，这货同样继承了DeepSeek的超长cot，面对一个简单的马尔可夫链问题截止到我输入这句话的现在，这个模型已经思考了20分钟有余，并且还在输出，后期已经完全变成多语言大杂烩，当然，与此同时他的老师DeepSeek也还在输出

Jo174 在 DeepSeek！看看你带出来的兵！中发帖

在我开始用mac本地部署大模型之后就热衷于下载各种支持mlx的模型测试能力，期待能找到一个在4bit量化下最好用的模型，本来在Gemma3n无法直接部署的前提下qwen3暂时得此殊荣，但突然发现还有一个deepseek-r1-0528-qwen3-8b，想着两个国产之光强强联手岂不美哉，然而结果却令我有些啼笑皆非 
首先我对DeepSeek偏抽象的语言风格持中立态度 我操，用户真的怒了 在DeepSeek的训练下，qwen毫无疑问的完美继承了这一风格，把原本的严肃抛在脑后，可惜马上更抽象的就来了，这货同样继承了DeepSeek的超长cot，面对一个简单的马尔可夫链问题截止到我输入这句话的现在，这个模型已经思考了20分钟有余，并且还在输出，后期已经完全变成多语言大杂烩，当然，与此同时他的老师DeepSeek也还在输出。 
于是为了验证这个问题是否实在太难了，我目前让qwen3 4b原版和Ge...