@keenthusiasm 在 【降智还是幻觉】由一篇公众号文章所想到的 中发帖
原文链接: 一道小学数学题,让DeepSeek最强蒸馏模型 R1-0528-Qwen3-8B陷入无限输出,这是ollama 的bug?
当时刷到这篇文章的时候,随手试了一下OAI的推理模型发现都能做对。于是突发奇想,把题目小改了一下
3.9-3.11+9.9-9.11=?
坏消息:o3 mini开始翻车了,把小数点(.)当成了点乘(·)来计算
[image]
好消息:o3、o4 mini 依然能做对
于是乎,把题目魔改得更“复杂”一些
1.9-1.11+2.9-2.11+...+8.9-8.11+9.9-9.11=?
这时候,o3和o4 mini 都出现了前述“把小数点当成点乘运算”的情况(当时以为是降智没截到图),再试的时候二者又能正常做对了
感觉这个问题会间歇出现,不清楚是降智还是幻觉