BlueSkyXNShare一个深度搜索结果数据集 中发帖

INFO 20250513/README.md · BlueSkyXN/AI-DeepResearch-BenchReport at main 
REPO BlueSkyXN/AI-DeepResearch-BenchReport at main
本数据集(20250513版本)收集了以下AI大模型的评测结果:

ChatGPT:

GPT-4.5-Team
GPT4o-Team
o3-Team
O3-DeepResearch-Pro
o4mini-Team
o4minihigh-Team
O4-mini-DeepResearch-Free


Claude:

MAX-Research
Pro-Claude3.7ST


阿里巴巴:

Qwen-2.5-MAX (深入研究模式)
Qwen-3-235B-A22B (深入研究模式)
Qwen-3 (分析研究模式)


Google:

G...