Schrödinger (@synbio)智谱刚刚发布了其全新端到端多模态模型:GLM-Realtime,近乎实时的视频理解与语音交互 中发帖

智谱刚刚发布了其全新端到端多模态模型:GLM-Realtime,近乎实时的视频理解与语音交互,融入了清唱功能,支持长达2分钟的记忆及Function Call功能 
GLM-Realtime在实现完全实时交互的基础上,进一步支持Function Call功能,这使其不仅能够依靠自身知识和能力,还能灵活调用外部知识和工具,拓展更广泛的应用场景
API:

现阶段可以免费调用