变色龙 (@bianselong) 在字节跳动豆包上线「深度思考」推理模式，覆盖问答、搜索、写作和阅读场景中发帖上周测试时，豆包相关负责人回应表示，当前测试的是自家深度思考模型的不同实验版本

变色龙 (@bianselong) 在字节跳动豆包上线「深度思考」推理模式，覆盖问答、搜索、写作和阅读场景中发帖

上周测试时，豆包相关负责人回应表示，当前测试的是自家深度思考模型的不同实验版本。还有消息称，豆包正在测试的深度思考模型是基于豆包 1.5 基座模型研发。 
IT之家查询发现，此前在 1 月中旬，豆包大模型团队在发布豆包 1.5 Pro 时就宣布了深度推理模型 Doubao-1.5-pro-AS1-Preview 的存在，并称其“在完全不使用其他模型数据的条件下，通过 RL 算法的突破和工程优化，充分发挥 Test Time Scaling 的算力优势，完成了 RL Scaling，研发了 Doubao 深度思考模式”。 
简单来说，深度思考模式可以让用户直观看到模型的思考过程，这中间涉及思维链的展示，也就是 COT（Chain of Thought）—— 思维链是模拟出来的，通过训练让模型输出中间步骤，比如自我质疑和反思，虽然只是文字序列，但看起来像人类的思考过程。 
在深度思考模式下，用...