@Debris 在 DeepSeek-R1-0528-Qwen3-8B发布了，超越Qwen3-8B 10% 中发帖悄咪咪的，DeepSeek发布了DeepSeek-R1-0528-Qwen3-8B. 在AIME 2024上，分数超过Qwen3-235B-thinking，其他的测试还是差一些的

@Debris 在 DeepSeek-R1-0528-Qwen3-8B发布了，超越Qwen3-8B 10% 中发帖

悄咪咪的，DeepSeek发布了DeepSeek-R1-0528-Qwen3-8B. 
在AIME 2024上，分数超过Qwen3-235B-thinking，其他的测试还是差一些的。 
除了Huggingface我还没找到哪里有这个模型。我笔记本跑不了bf16的8B模型，不知道有没有站内的佬帮忙来测试一下看看。或者得等llama cpp帮忙quant到q4_k_m了，然后我本地ollama跑了。 
 [image]