欣 郁 (@user1164) 在 所以新版deepseek-R1的实际输出长度还是8k? 中发帖
如图,新版deepseek-R1最显著的特点是思维链明显延长,所以输出长度最大 64k主要是给思维链的,实际上给答案的输出长度应该还是8K?
[image]
一个例子是,我让新版deepseek-R1根据一些内容写一篇综述,prompt里面要求写12000字,它在思维过程中写到“由于我一次性无法输出12000字,可能需要分批次输出”