@bohe 在 reason_content是不是比<think>块好用呢? 中发帖
deepseek官方的R1不同于第三方的R1,是把思考做特殊处理后塞进了reason_content,这样做的话,可以让下一次对话,思维链不进入上下文记录当中,也就大大的释放了上下文的压力。
deepseek官方的R1不同于第三方的R1,是把思考做特殊处理后塞进了reason_content,这样做的话,可以让下一次对话,思维链不进入上下文记录当中,也就大大的释放了上下文的压力。