@PSP 在 Gemini 2.5 Pro有点强啊，我写深度研究报告，用下来断档碾压其他模型中发帖我拿自己深度研究报告的提示词问题，测了一下

@PSP 在 Gemini 2.5 Pro有点强啊，我写深度研究报告，用下来断档碾压其他模型中发帖

我拿自己深度研究报告的提示词问题，测了一下。 
结果是断档式碾压o1、Claude 3.7 Thinking、o3 mini-high。 
只有2美元问一次的Deep research，靠着智能体代理才能超过它。 
估计能超过Gemini 2.5 Pro，只有o3正式版或者未来Claude 4。  唯一的缺点是，字数的输出似乎有点限制，显得比较克制。