kejun (@ke_jun) 在 250107 三花AI日报:Sam Altman 亏麻了,预测今年 AI 将加入劳动力市场; lmsys 文生图竞技场:Recraft V3 领跑;VITA-1.5:开源多模态视频语音大模型;阿里开源 VideoRefer:利用 LLM 实现视频对象感知与推理 中发帖
阿里开源 VideoRefer:利用 LLM 实现视频对象感知与推理
player.bilibili.com/player.html?bvid=BV1f6r1YqECv
VideoRefer 是阿里开源的一项专门用于视频中对象的感知和推理的技术。该技术包括数据集、模型和基准测试三大核心组件,能够对用户定义的区域进行细粒度的感知、推理和检索,支持单帧和多帧输入。简单来说,就是利用 LLM 来理解视频内容。目前,该模型的代码和模型均已开源。
OpenAI CEO Sam Altman 预测:2025 年 AI 代理将加入劳动力市场
[图片]
Reflections 是 OpenAI 的 CEO Sam Altman 在其博客上发表的一篇文章。文中,他表达了对构建传统意义上的通用人工智能(AGI)的强烈信心,并预测到 2025 年,AI 代理将“加入劳动力市场”,从而实质性地改变公...