@DebrisDeepSeek-R1-0528-Qwen3-8B发布了,超越Qwen3-8B 10% 中发帖

悄咪咪的,DeepSeek发布了DeepSeek-R1-0528-Qwen3-8B. 
在AIME 2024上,分数超过Qwen3-235B-thinking,其他的测试还是差一些的。
除了Huggingface我还没找到哪里有这个模型。我笔记本跑不了bf16的8B模型,不知道有没有站内的佬帮忙来测试一下看看。或者得等llama cpp帮忙quant到q4_k_m了,然后我本地ollama跑了。
[image]