BlueSkyXN 在 Share一个深度搜索结果数据集 中发帖
INFO 20250513/README.md · BlueSkyXN/AI-DeepResearch-BenchReport at main
REPO BlueSkyXN/AI-DeepResearch-BenchReport at main
本数据集(20250513版本)收集了以下AI大模型的评测结果:
ChatGPT:
GPT-4.5-Team
GPT4o-Team
o3-Team
O3-DeepResearch-Pro
o4mini-Team
o4minihigh-Team
O4-mini-DeepResearch-Free
Claude:
MAX-Research
Pro-Claude3.7ST
阿里巴巴:
Qwen-2.5-MAX (深入研究模式)
Qwen-3-235B-A22B (深入研究模式)
Qwen-3 (分析研究模式)
Google:
G...