Ryan (@StardustAlN) 在 编程界奥赛冠军 OlympicCoder 中发帖
【转自Huggingface BiliBili官号】
来自 Hugging Face 科研团队最新发布的 OlympicCoder 系列推理模型重磅登场 🚀
它不仅在 Codeforces 等平台表现亮眼,还直接击败了 Claude 3.7 Sonnet 等超百倍参数的大模型!超硬核数据集也与模型一同发布了 👇
📊 重点数据集包括:CodeForces-CoTs:
最火编程竞赛平台题库,含 C++ 与 Python 的逐步推理过程!
IOI’2024 Benchmark:覆盖历年信息学奥赛题(IOI),难度爆表,SOTA 模型都难以匹敌人类表现!
Stack-Edu:1250 亿 Token 的多语言代码教育数据,堪称代码界的 FineWeb-Edu!
GitHub Issues:110 亿 Token 的 GitHub 讨论数据,提升模型对真实开发语境的理解!
Kagg...