@JJFenggg如何量化比较模型的能力? 中发帖

每当一个新模型问世,有的人会说xxx好强,也有人说xxx不如xxx。这些结论似乎都是通过一种主观的感受来得出的,那么有没有一种方法可以对模型的能力进行一个量化,就像对cpu跑分一样?