Jo174DeepSeek!看看你带出来的兵! 中发帖

在我开始用mac本地部署大模型之后就热衷于下载各种支持mlx的模型测试能力,期待能找到一个在4bit量化下最好用的模型,本来在Gemma3n无法直接部署的前提下qwen3暂时得此殊荣,但突然发现还有一个deepseek-r1-0528-qwen3-8b,想着两个国产之光强强联手岂不美哉,然而结果却令我有些啼笑皆非 
首先我对DeepSeek偏抽象的语言风格持中立态度 我操,用户真的怒了 在DeepSeek的训练下,qwen毫无疑问的完美继承了这一风格,把原本的严肃抛在脑后,可惜马上更抽象的就来了,这货同样继承了DeepSeek的超长cot,面对一个简单的马尔可夫链问题截止到我输入这句话的现在,这个模型已经思考了20分钟有余,并且还在输出,后期已经完全变成多语言大杂烩,当然,与此同时他的老师DeepSeek也还在输出。
于是为了验证这个问题是否实在太难了,我目前让qwen3 4b原版和Ge...