Earmer Carey (@earmer)近期LMARENA的匿名测试模型汇总 中发帖

vail:上下文似乎很短(回答一半截断),智商还行。
acadia:智商不错,略逊于2.5 Pro。
shasta:智商波动大。

欢迎各位补充。