(@duanluan) 在 AI 大语言模型排行榜汇总 中发帖
Chatbot Arena (formerly LMSYS)
Chatbot Arena 是一个开源的众包人工智能基准测试平台,由加州大学伯克利分校 SkyLab 和 LMArena 的研究人员开发。凭借超过 100 万用户的投票,该平台使用 Bradley-Terry 模型对最佳 LLM 和 AI 聊天机器人进行排名,生成实时排行榜。
排行版:https://lmarena.ai/?leaderboard
CLUE 中文语言理解测评基准
内容体系:代表性的数据集、基线 (预训练) 模型、语料库、论文、工具包、排行榜。
SuperCLUE 使命:精准量化 AGI 进展,定义人类迈向 AGI 路线图
CLUE 定位:为更好的服务中文语言理解、任务和产业界,做为通用语言模型测评的补充,通过搜集整理发布中文任务及标准化测评等方式完善基础设施,最终促进中文 NLP 的发展。
排行榜:h...