@jerryust 在 DeepSeek-R1 思考输出截断各家API比较 中发帖
DeepSeek-R1服务的水很深,整个市场都是鱼龙混杂。先不说这个模型本身就有好几个不同参数大小的版本以及蒸馏版,就算是号称自己是满血版本的DeepSeek-R1,上下文窗口和输出长度也不尽相同,多家的“满血版”DeepSeek-R1存在输出截断。
既然是思考模型,思考深度不够还叫什么思考模型。
测试问题如下:在平面四边形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。将\triangle ACD沿AC翻折至\triangle ACP,其中P为动点。 求二面角A - CP - B的余弦值的最小值。
此题为八省联考压轴数学题,正确答案为 sqrt(3)/3 。
目前我测试下来的几家API的情况如下:
DeepSeek官方:官方版本没有崩的话做这道题很稳。用时8分钟。
字节火山:有时候...