@dwqxq1【原创长文】O3 Deep research vs 2.5-pro Deep research 中发帖

以下观点来源于我同一提示词,同时生成O3与2.5-pro Deep research,反复阅读全文或听全文音频之后的个人总结,每人研究主题不同,需求不同,仅代表个人观点 
二者相当的
字数相当:O3和2.5-pro正文都是一万多字。O4-mini和2.0-flash-thinking是大几千字,其他Deep research好的大几千字,差的小几千字
O3优胜的
O3底模更强
在绝大多数大模型评测中,O3(应该是med)分数都是高于2.5pro的,而且Deep research是否用了O3-high或O3-pro也不确定,如果是的话,底模还高于O3-med
O3与主题关联更强
O3较少跑题。2.5-pro经常性跑题,有时真是洋洋千言,离题万里,80%内容都是跑题的,字越多,章节越多,跑题越严重
O3链接到原文具体句子
O4-mini也是链接到具体句子,2.5pro和其他所有De...