‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‏ (@duanluan) 在 AI 大语言模型排行榜汇总中发帖Chatbot Arena (formerly LMSYS)Chatbot Arena 是一个开源的众包人工智能基准测试平台，由加州大学伯克利分校 SkyLab 和 LMArena 的研究人员开发

‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‏ (@duanluan) 在 AI 大语言模型排行榜汇总中发帖

Chatbot Arena (formerly LMSYS)
Chatbot Arena 是一个开源的众包人工智能基准测试平台，由加州大学伯克利分校 SkyLab 和 LMArena 的研究人员开发。凭借超过 100 万用户的投票，该平台使用 Bradley-Terry 模型对最佳 LLM 和 AI 聊天机器人进行排名，生成实时排行榜。 
排行版：https://lmarena.ai/?leaderboard 
CLUE 中文语言理解测评基准
内容体系：代表性的数据集、基线 (预训练) 模型、语料库、论文、工具包、排行榜。 
SuperCLUE 使命：精准量化 AGI 进展，定义人类迈向 AGI 路线图 
CLUE 定位：为更好的服务中文语言理解、任务和产业界，做为通用语言模型测评的补充，通过搜集整理发布中文任务及标准化测评等方式完善基础设施，最终促进中文 NLP 的发展。 
排行榜：h...