Dawn (@dawn2)关于AI编写操作手册等大量截图及图片标注类工作的思考 中发帖

在产品工作中,发现尚有编写操作手册、写运维文档、指南等等这类型很基础工作,无法顺畅的使用AI,从而引发思考 
操作手册依赖于现有的系统进行页面截图、图片标注辅以文字说明实现指导的问题,但是codex目前尝试了多轮无法实现
尝试1:使用codex自带的浏览器功能登录系统,让他自动操作截图,局限:无法准确点击,而且截图的区域很小,无法页面截图,也考虑过缩放,但是也有页面畸形问题。无法熟知操作逻辑,不能形成操作思路。
尝试2:让codex通过终端调用电脑内浏览器,局限:不能后台运行,必须干看着codex去调用,不可自己在操作电脑,操作思路同上,但是可以截图成功
尝试3:给codex前端代码+调用电脑浏览器,让他整理思路在嗅探操作逻辑去点击,局限:截图成功,操作逻辑不成立、图片标注错位
尝试4:自己给codex讲述清楚操作逻辑,让他调用电脑浏览器,同理图片标注错位,截图存放混乱
大家如果...