synz如何评估模型性能? 中发帖

不同渠道或者平台的同一名称的开源或闭源模型性能不太一样,一般如何比较性能优劣?有哪些方案?