Mozi (@yeahhe)开源Gemini Vision Pointer:测试模型图片理解力和Çomputer Use能力,欢迎佬友测试 中发帖

从利用Gemini 3视觉能力测试鼠标指向性,Gemini完全可以利用视觉控制鼠标,Agent未来可期 
继续讨论
https://ai.studio/apps/drive/101UDn_eNlC8C7ZFxMJmtugtpMcg8VtzY
目前使用Gemini 3,欢迎佬友魔改
[image]
[image]
[image]
[image]
[image]
[image]