拾雨 (@c519127) 在 蚂蚁灵波一周“四连发”,“卷”向具身智能基座开源 中发帖
蚂蚁集团旗下具身智能公司灵波科技本周接连开源四个大模型。
1月30日,蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。LingBot-VA提出自回归视频-动作世界建模框架,将大规模视频生成模型与机器人控制深度融合,模型在生成“下一步世界状态”的同时,直接推演并输出对应的动作序列,让机器人能够像人一样“边推演、边行动”。
而从1月27日至29日,灵波科技已相继开源高精度空间感知模型 LingBot-Depth、具身大模型 LingBot-VLA和世界模型 LingBot-World。
其中,LingBot-Depth模型与奥比中光合作,主要攻克的是机器人的视觉难题,让机器人精准抓取透明反光物,更能够“看清楚”物理世界。而LingBot-VLA是蚂蚁开源的第一款具身智能基座模型,实现了跨本体、跨任务泛化能力,推动“一脑多机”走向可规模化落地,缓解具身智能模型落地面临的泛化性问题。L...