LINUX DO Channel

Terrasse 在和ChatGPT打个视频电话 - OpenAI 12 Days - Day 6 中发帖
省流：高级语音模式支持实时视频输入 

启动高级语言模式时，可以开启摄像头，模型可以根据视频画面实时提供帮助
可以共享手机屏幕画面作为视频输入
plus和pro订阅用户都将获得升级了视频功能的高级语言模式
官方训练了一个“圣诞老人”的角色可以与之对话，具有单独的使用额度

评价： 
一言难尽。 
从科研人员的角度来讲，多模态实时对话其实是很难做的（直播中展示了模型可以recall一段时间之前介绍给它的人脸，说明是具有实打实多模态上下文的），对模型能力和算力要求都不低，我非常好奇OpenAI是如何做到把这样的功能开放给那么多用户。 
但是，从用户的角度，OpenAI不过是兑现了一个早就画出来的饼。一定会有很多人这样讲：“不就是语音对话模式加了个图像吗？而且9月份就见过了啊。OpenAI真没劲！” 这也是无可辩驳的事实。