@skylertong 在 [开源自荐]基于VLM/UI感知树的PolarisDesk - AI桌面助手【求🌟】 中发帖
可基于VLM,也可以直接基于UI树感知
[1]
[2_compressed]
一款集成多种主流 AI 服务的桌面助手应用,致力于让 AI 真正融入你的日常工作流程,成为随时可用的智能生产力伙伴。
主要功能
🤖 AI 对话集成
支持 OpenAI、Claude、Google、DeepSeek 等 10+ AI 服务商
一个应用统一管理所有 AI 账号,告别频繁切换平台的繁琐操作
✨ 智能交互
人设预设系统:快速切换不同 AI 角色,适配多种使用场景
悬浮窗口模式:随时唤起 AI 助手,不打断当前工作
自然语言控制系统命令:用“说话”的方式完成复杂操作
📄 文档处理
支持 PDF / PPT / Word 等多种文档格式解析
智能截图功能:AI 可直接理解并分析截图中的内容
🚀 独特能力
UI 树感知技术(macOS):自动识别当前窗口的界面结构,让 AI 理解你正...