3 月 31 日消息,高德宣布全量开源具身操作基座模型 ABot-M0。据介绍,该模型采用统一架构设计,目标是以“通用大脑”适配不同形态的具身机器人,实现跨场景通用操作能力。

据悉,该模型在 Libero、Libero-Plus、RoboCasa 等多个权威基准测试中实现 SOTA。其中在 Libero-Plus 基准上,该模型的任务成功率达 80.5%,较业界此前的标杆方案 Pi0 提升近 30%。
据悉,此次开源覆盖数据、算法与模型三个层面。在数据方面,ABot-M0 开放了通用机器人数据集 UniACT,包含超过 600 万条真实操作轨迹,并提供从原始数据到标准化训练数据的处理流程。通过统一动作表示、坐标体系与控制频率,实现不同机器人数据的整合使用。
在算法方面,ABot-M0 开源了完整模型架构与训练框架,并引入动作流形学习(AML)算法及双流感知架构。前者通过直接预测可执行动作序列,减少试错过程;后者结合视觉语言模型与三维模块,以提升语义理解与空间感知能力。
在模型层面,ABot-M0 提供端到端预训练模型及配套工具链。开发者可在此基础上进行二次开发,用于工业或家庭等应用场景。统一架构设计也被用于验证“一个大脑驱动多种形态”的可行性。(定西)
