Mozi (@yeahhe) 在 开源Gemini Vision Pointer:测试模型图片理解力和Çomputer Use能力,欢迎佬友测试 中发帖
从利用Gemini 3视觉能力测试鼠标指向性,Gemini完全可以利用视觉控制鼠标,Agent未来可期
继续讨论
https://ai.studio/apps/drive/101UDn_eNlC8C7ZFxMJmtugtpMcg8VtzY
目前使用Gemini 3,欢迎佬友魔改
[image]
[image]
[image]
[image]
[image]
[image]