智元机器人姚卯青:以世界模型驱动飞轮,解锁具身智能规模化应用

2025-08-13 14:26:57     来源:

8月10日,2025 世界机器人大会在北京举行。智元机器人合伙人兼具身业务部总裁姚卯青在会议上发表了题为《通向具身智能大规模突破之路——智元的本体数据算法飞轮》的演讲,系统阐述了智元在具身智能领域的探索成果与未来方向。

姚卯青介绍,上海智元机器人成立于 2023 年 2 月,自创立起便致力于推动 AI 与机器人的深度融合。至今,智元已取得一系列扎实成果:发布全系列多款机器人产品,建成规模化生产产线与机器人训练场数据采集中心,在具身智能相关算法领域实现多项创新,并在多个实际应用场景完成探索验证,为技术落地筑牢根基。

姚卯青强调,机器人企业要让软硬件产品在行业有效落地,核心在于构建 “本体 - 数据 - 模型 - 场景” 紧密耦合的全栈布局。这四者形成相互驱动的飞轮迭代逻辑:优质本体产生高质量数据,海量高质量数据支撑算法持续突破,算法结合场景试错后,又为本体优化、数据采集方向、算法迭代提供新指引。这种闭环循环不断加速,未来智元将分享更多飞轮迭代成果。

“进入飞轮循环的首个挑战是数据。”姚卯青指出,与大语言模型从业者不同,机器人从业者需直面物理世界强交互特性,既要调试硬件,又要将模型部署到工业级系统测试,这使得数据需求与互联网数据存在本质差异。

“然而,现有互联网数据对机器人训练远远不够,” 姚卯青解释道,“机器人需要大量动作类、长程规划类数据,这类数据在网络上极为稀缺。” 为此,智元希望 “种下第一棵树”,吸引更多同行加入数据建设,共同形成数据海洋,目前这一探索已取得阶段性成果。

为破解数据难题,智元于2024年底开源了AgiBot World百万真机数据集。姚卯青表示,该数据集旨在提供工业级高质量数据支撑,包含百万条机器人数轨迹,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样。

姚卯青还表示,AgiBot World数据集只是起点,智元在数据采集方式上有两项关键创新:

对抗式采集数据:在常规数据采集过程中主动引入干扰,例如改变语言指令、制造视觉扰动等,以此提升数据信息密度。实践证明,这种方式能提供数倍于常规数据的信息量,有效加快机器人训练收敛速度,且已在多任务和多构型机器人上验证效果。

自主进化式的数据采集:针对机器人在真实环境中自主执行任务时难以提前枚举的 “长尾失效” 问题,智元引入自主进化式采集方案。 当机器人执行任务失效瞬间,系统自动接管并打断进程,回退到失效前状态,再通过人工接管完成数据采集。这一方式能将难场景下的高价值数据补充到训练集,有效拓展数据分布边界,依托数据扩增提升机器人能力上限,其逻辑类似 Dagger 算法框架。

姚卯青说,围绕数据消费,智元于今年 3 月推出具身智能基座模型GO-1 。该模型在架构上实现双重创新:依托 VLM 基础模型和 MOE 混合专家架构,其中 “隐式动作专家” 融合多源数据形成通用动作表达,“显式动作专家” 则将通用描述精准落实到特定本体控制,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。

姚卯青指出,GO-1 模型发布后,其在生活、零售、工业三大场景的评测中表现尤为亮眼。相较于 3 月时的海内外开源模型,成功率提升 10%-30%。同时,智元发布的AgiBot World数据集,能够很好的验证 Scaling Law,研究揭示了预训练关键规律:数据量、多样性及质量对模型性能影响显著,且实验证明,单一本体预训练数据的后训练迁移效果优于多本体数据。这表明,机器人预训练的核心在于数据场景的多样性、质量,以及适配的模型设计。

“除 GO-1外,智元团队深耕世界模型方向,秉持 “生成理解一体化” 理念。正如人类做事前会在脑海中规划推演,机器人也需依托世界模型精准推演,缩短与实际操作的差距。测试显示,在智元自身本体的多任务测试中,GE-Act 效果优于近期开源的 UniVLA 和 NVIDIA 的 GR00T 模型;针对跨本体迁移能力,以AgiBot World数据集训练的 GE-Base 模型,在 Franka 等本体上表现优异,在开源 Benchmark 和真机测试中,成功率显著高于现有开源模型。”姚卯青说

姚卯青强调,基于世界模型生成的动作,智元机器人能完成叠衣服、组装纸盒等复杂双臂灵巧操作,也能在工业传送带上精准执行物体抓取和打包任务。值得注意的是,相较于 VLA 等短时序输入输出模型,具备长时序推演能力的 GE-Act 在动态场景抓取定位精度上优势明显。

GE-Sim 以动作序列为输入,如同高精度仿真器,能在杂乱真实环境中渲染画面,且具备时空一致性和语义合理性。对比测试显示,其与真实机器人的推理效果高度一致,量化成功率接近。姚卯青说,依托该仿真器,可快速迭代机器人策略,极大缩短模型研发周期,减少实际评测中的复杂流程与损失。

姚卯青表示,为规范世界模型评测,智元推出 GE Bench 并已在 GitHub 和 HuggingFace 开源,成为 IROS 世界模型挑战赛的重要准备工具。 该 Benchmark 从轨迹遵循度、语义合理性、因果一致性等多维度评估模型,而基于机前数据预训练的 GE-Base 模型,在各维度表现均优于主流视频生成类模型。

姚卯青分享了智元在机器人研发中的实践心得:机器人本质要回归执行器,优质执行器是性能基础;传感器虽重要,但调教与量产一致性是行业难题;若聚焦单一机器人类型,人形是较合理的选择;具身智能应是 “机器人 + AI”,需深度结合硬件本体;此外,必须追求量产和一致性,以减少各环节误差。

姚卯青表示,智元计划将上述 “苦涩教训” 融入飞轮迭代,并于今年下半年推出新一代机器人 AgiBot G2。该平台采用更灵巧的本体设计,对传感器、执行器提出更高标准,搭载英伟达 Thor 高算力量产域控制器,被定义为 “工业级交互式具身智能作业全球标杆平台”,引发行业广泛关注。

姚卯青强调,“数据 - 模型 - 本体 - 场景” 飞轮的转动,最终是为赋能千行百业。过去一年,智元在多场景取得突破:柔性制造中,用具身智能解决专业设备无法应对的高精度、力控、泛化性操作问题;物流分拣上,具身智能通用机器人与专用设备配合,处理传统视觉定位 + 规划难以完成的杂乱物品分拣;此外,还实现了安检岗点人力清零、电力通信机房巡检操作等场景的人力替代与降本增效。

“具身智能赛道广阔,” 姚卯青呼吁,“希望全球同行携手,共同探索这一智能边疆,让技术真正创造价值。”

 

标签:

猜你喜欢

华为(中山)产业AI促进中心启动,共筑中山“产业焕新之城”
教育生态新样本:家辉教育以校友会为纽带打造从学业助力到终身同行共同体
这些习惯竟让我免疫系统紊乱?幸好cns藏红花益生菌助我重拾健康生活
那川白茶茶饮荣获尚普咨询集团系列市场地位声明
柠季举办华东合作伙伴大会:共拓财富蓝海 共筑增长新程
中银三星人寿“故宫小书包”乡村儿童故宫夏令营正式开幕
冰丝带开赛在即!中国联通智慧网络构筑冰丝带无界竞技场
近十年动作犯罪电影最高分!爱奇艺出品《捕风追影》预售中VIP会员购票低至14.9元
校企联动,智绘未来:哈尔滨工程大学深圳校友企业联盟探访博大数据前海智算中心
学院8号等你来——理想生活狂想周落幕,为城市留下一处“精神缓冲带”
GT世界挑战赛十月登陆北京亦庄 全球顶尖车手决战“通明湖赛道”
西北蜂蜜的骄傲:众天蜂蜜的匠心传承
打破血糖管理困局:脆皮年轻人正解锁健康新范式
众天蜂业:守护秦岭甜蜜,创新驱动蜂业未来
一项“少而难”的手术,这家医院如何2年完成200例?
MindSight品牌心智营销发布会精华解读
美联储降息预期或将影响全球资产格局
TOP1!昱能科技荣登Sinovoltaics全球光伏逆变器制造商财务健康排行榜
秦岭馈赠,匠心至臻:众天蜂业重塑西北高端蜂蜜品质标杆
天猫国际母婴超会养,写给成长的营养剧透,持续共筑美好成长
大模型商业化加速落地,算力龙头AI服务器业绩释放
天猫千星计划携手运动户外,打造新势力品牌闭门会、助力户外品牌跃迁
快手科技副总裁宋婷婷:数字技术赋能女性发展,助力女性展现创新力与领导力
天山少年沐书香,多元弦歌润边疆 帆书“书卷里的乌鲁木齐”活动圆满落幕
西北旅游热催生航空新需求 墨迹天气AeroMetis平台成航司“智慧决策大脑”
2025“低空丝路”快递无人机应用论坛
AGEVIVE 复合滋补饮品:探索健康生活的新方式
游戏+科技+文旅,2025穿越火线IP嘉年华携手深圳打造前沿国潮体验
华西证券×火山引擎:完善数据治理,助力AI+
精准破解行业三大痛点 工行携手京东政企业务引领金融行业国产化替代转型