Terrasse 在 和ChatGPT打个视频电话 - OpenAI 12 Days - Day 6 中发帖
省流:高级语音模式支持实时视频输入
启动高级语言模式时,可以开启摄像头,模型可以根据视频画面实时提供帮助
可以共享手机屏幕画面作为视频输入
plus和pro订阅用户都将获得升级了视频功能的高级语言模式
官方训练了一个“圣诞老人”的角色可以与之对话,具有单独的使用额度
评价:
一言难尽。
从科研人员的角度来讲,多模态实时对话其实是很难做的(直播中展示了模型可以recall一段时间之前介绍给它的人脸,说明是具有实打实多模态上下文的),对模型能力和算力要求都不低,我非常好奇OpenAI是如何做到把这样的功能开放给那么多用户。
但是,从用户的角度,OpenAI不过是兑现了一个早就画出来的饼。一定会有很多人这样讲:“不就是语音对话模式加了个图像吗?而且9月份就见过了啊。OpenAI真没劲!” 这也是无可辩驳的事实。