kapas 在【AI排名】与实际表现的比较，Xai太扯了

kapas 在【AI排名】与实际表现的比较，Xai太扯了。。。。。。。中发帖

lmarena转发了下图 
左侧被高估，右侧被低估 
国内模型不错啊 
最近我在写论文，正好对比了下 
总体感觉还是claude最好 
国内qwen，deep，glm plus， 01，感觉差不多 
plus并没有特别优势 
01感觉说的很多，很像人说的 
gemini 1121没看出优势，没感受到大家说的更人性化 
xai感觉不错，感觉比1121好 
可这图也太扯了 
感觉和实际不符合 
 [Screenshot_2024-12-02-08-22-25-787_com.twitter.android]