@HLiny 在 【讨论】Gemini的思考和生成是否有可能是不同的模型 中发帖
最近vertex开始输出思考内容了,用了几天发现有点不一样:
(1)即使在流式输出下,思考内容也是一个模块一个模块蹦出来,而不是像正文一样一个字一个字生成;
(2)CoT的内容风格也和正文的风格高度不同,不像deepseek那样思考和正文是一个风格。
(3)我看到有的酒馆prompt可以让gemini不按常规格式思考,而是按用户指定的步骤,此时思维链可以变成中文,而且风格和正文一致。
所以我有两个猜测:
(1)gemini的CoT和正文生成不是同一个模型,由模型A产生CoT再由模型B生成正文
(2) gemini输出的不是真正的CoT,而是一个梗概(这和o系列是一样的,但是考虑到输出的思维链很长,这个假设可能性不大)
佬友们有什么看法吗? 🤔