欣欣|林可欣 (@StellaFortuna) 在 arena更新「Agent mode」 类似于grok4.2 思考强度低,任务完成率低 中发帖
从Arena 竞技场 更新了一个 Agent Mode继续讨论:
我昨天晚上就看到了,不过没说
论坛没有收到太多信息,应该确实没有全量开放
红迪社区有讨论:
grok也参考了这一篇 给了一个简要介绍:
[Screenshot20260510131216]
[Screenshot20260510131223]
实际体验的话,我发给他一段代码,让他帮我按要求进行修改 他立即启动了,但没有立即开始agent互相询问模式,大概过了3秒钟,闪了几个概括性的提示语之后,就开始ask这个,ask那个了 🫠 所以这方面还蛮像grok的
最终回答的时候是一个简要的思考,只思考了一段
然后就直接输出了代码,一句话都没有说
然后代码改的很失败,直接报废了
对比来说,我把同样的提示词原封不动发给gpt5.5instant,完全正确,完美修改