@PSP 在 Gemini 2.5 Pro有点强啊,我写深度研究报告,用下来断档碾压其他模型 中发帖
我拿自己深度研究报告的提示词问题,测了一下。
结果是断档式碾压o1、Claude 3.7 Thinking、o3 mini-high。
只有2美元问一次的Deep research,靠着智能体代理才能超过它。
估计能超过Gemini 2.5 Pro,只有o3正式版或者未来Claude 4。 唯一的缺点是,字数的输出似乎有点限制,显得比较克制。