ItTakes (@aitech) 在 试了下droidrun,浪费了我2M Token 中发帖
今天下午试用了一下号称安卓界的Browser-use: droidrun:
我是用的Gemini 2.0 Flash和Deepseek-V3模型,俩都都试了一遍。
但是试了三个任务指令,只有一个成功了:
打开高德地图查看骑电动车到附近的XX体育馆需要多少时间
打开某APP,使用测试账号密码登录,然后修改昵称到:AITest。
打开(已登录测试账号)的某APP,然后修改昵称到AITest。
其中1使用Gemini成功,其余的都没成功。任务3是2的简化版。因为任务2连登录都不会(页面上提供了密码登录和验证码登录,Agent在明确要求它使用密码登录的情况下总是点验证码登录,然后无法修正错误路径,直到迭代结束。)
任务执行期间遇到了各种问题,例如无法找到输入框元素,打开错了APP,点错了按钮和页面。
甚至API的429还会被模型读取到上下文用来ReAct,真是让人迷惑。
我也尝试...