变色龙 (@bianselong) 在 字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景 中发帖
上周测试时,豆包相关负责人回应表示,当前测试的是自家深度思考模型的不同实验版本。还有消息称,豆包正在测试的深度思考模型是基于豆包 1.5 基座模型研发。
IT之家查询发现,此前在 1 月中旬,豆包大模型团队在发布豆包 1.5 Pro 时就宣布了深度推理模型 Doubao-1.5-pro-AS1-Preview 的存在,并称其“在完全不使用其他模型数据的条件下,通过 RL 算法的突破和工程优化,充分发挥 Test Time Scaling 的算力优势,完成了 RL Scaling,研发了 Doubao 深度思考模式”。
简单来说,深度思考模式可以让用户直观看到模型的思考过程,这中间涉及思维链的展示,也就是 COT(Chain of Thought)—— 思维链是模拟出来的,通过训练让模型输出中间步骤,比如自我质疑和反思,虽然只是文字序列,但看起来像人类的思考过程。
在深度思考模式下,用...