作业君 (@homeworkkun)150个国内外AI大模型性能排行与价格详情(含赠金情况,2月6日版本) 中发帖

基于LiveBench各项目分数的模型性能与价格排行 
国外模型大多为1125版本题库 LiveBench官网
国内模型大多为0831版本题库(我自测的) Github
同一个模型1125版本一般分数略低一些
预览:
[c7f0a7a8-5a08-4422-9ff2-7302f960d238]

总分完整版

推理

代码

数学

数据分析

语言

指令跟随

原始Excel表格如下
大模型性能价格20250206.zip (84.1 KB)

跑分只是参考,请以实际体验为准!!
跑分只是参考,请以实际体验为准!!
跑分只是参考,请以实际体验为准!!