kapas 在 【AI排名】与实际表现的比较,Xai太扯了。。。。。。。 中发帖
lmarena转发了下图
左侧被高估,右侧被低估
国内模型不错啊
最近我在写论文,正好对比了下
总体感觉还是claude最好
国内qwen,deep,glm plus, 01,感觉差不多
plus并没有特别优势
01感觉说的很多,很像人说的
gemini 1121没看出优势,没感受到大家说的更人性化
xai感觉不错,感觉比1121好
可这图也太扯了
感觉和实际不符合
[Screenshot_2024-12-02-08-22-25-787_com.twitter.android]