@HCPTangHY豆包2.0又SOTA了?我的评价是:抬走 中发帖

首先豆包网页上的模型是残血的 
[image]
区一样
然后我专门去火山引擎开了个API来跑测试
[image]
你究竟吃了多少claude
[image]
贪吃蛇不是你自己的案例吗
[image]
我选的是high没错啊
[image]
红警倒还凑活,可以也做了一坨
平均每个题目都要思考300-500秒,有这时间我为什么不去用5.3 codex-xhigh呢
[image]
——————
在仔细看看思维链,你这调的什么玩意啊
[image]
[image]
到最后直接哦哦哦哦哦哦哦哦哦哦齁齁齁了
多模态测试

猜猜这是什么事
[image]

[image]

[image]
[image]

还不如上个月阶跃的小模型呢
赶快抬走
————————————
对了,还有个code模型
[image]
贪吃蛇都报错吗,那你...