阳光彩虹小白马 (@Creasys)livebench的Coding评分真就图一乐(已更新R1-0528) 中发帖

[PixPin_2025-05-30_11-03-16] 
之前没太注意,按Coding排序后,看乐了
老R1大杀四方,新R1唯唯诺诺
Claude折戟沉沙,Gemini难以出头
只有OpenAI笑傲群雄了
:bili_001: