银河通用X清华大学发布首款开源人形机器人全身遥操系统OpenWBT
创始人
2025-06-12 17:11:39
0

该论文由清华大学与北京银河通用机器人有限公司合作完成。论文的共同第一作者为清华大学学生张智楷、薛晗,银河通用研究团队成员陈超,指导老师为清华大学助理教授弋力与北京大学助理教授王鹤。

大数据和大模型已成为具身智能领域业界和学术界的焦点,人们也在期待人形机器人真正步入大数据、大模型时代。然而,行业一直缺乏稳定的人形机器人全身遥操作与数据采集方案。

近日,银河通用机器人携手清华大学发布了全开源、多机型、跨虚实的人形机器人全身遥操作系统——OpenWBT。即便是新手,也能在小时内从零完成部署,并以接近日常人类工作空间的方式,高效采集人形机器人全空间操作数据,为打造具备操作智能的人形机器人提供坚实的数据支撑。目前 OpenWBT 已经在 GitHub、Gitee 等开源平台全面上线。

  • 论文标题:Unleashing Humanoid Reaching Potential via Real-world-Ready Skill Space
  • 相关论文:https://www.arxiv.org/pdf/2505.10918
  • 项目主页:https://zzk273.github.io/R2S2/
  • GitHub:https://github.com/GalaxyGeneralRobotics/OpenWBT
  • Gitee:https://gitee.com/GalaxyGeneralRobotics/OpenWBT

为什么需要「全身遥操」?

「如果机器人只能站直不动,它的作业空间可能还不如一台扫地机。」研究团队成员解释道。传统遥操作往往仅依赖上半身控制,而 OpenWBT 通过全身运动控制,让机器人实现移动、碰高、摸低等多种能力。只需要一款 VR 头显,就可以遥控多种机器人,使其像人类一样弯腰拾起地上的物品,或伸手擦拭高处的窗台。

OpenWBT 三大技术亮点

  • 极简部署方便使用

只需要一副 VR 头显、一台笔记本电脑,新手也可以在小时内从零完成系统的快速部署。不受场地限制、无需复杂的设备校准与穿戴,躺在家里床上,也可以遥控千里之外的机器人。

  • 多机型跨平台轻松操作

OpenWBT 不仅兼容 29 自由度的 Unitree G1,还支持拥有成人身高的 Unitree H1,可轻松覆盖成年人完整的工作空间,成为对人类劳动力的有力补充。

  • 灵活兼顾虚实遥操

OpenWBT 同时支持在真实世界和仿真环境中进行遥操作。在真实世界中遥操作,可避免感知与控制的域偏差,直接获得高质量机器人数据;在仿真环境中遥操作,无需搭建物理场景,便于快速采集和大规模数据增强,提高样本效率,并为后续模型的泛化能力奠定基础。

首先将运动分为若干原子技能(如走、蹲、前倾等),针对每种原子技能设计专门的奖励函数与训练策略,使其可以稳定迁移到真实世界中。然而,当机器人需要在这些原子技能之间频繁切换的时候,由于缺少对技能间组合与过渡的建模,机器人仍然难以保证稳定。

因此,进一步通过强化学习对原子技能的组合与衔接进行优化,并利用条件变分自编码器对包括原子技能及其组合衔接在内的各种底层控制进行统一生成式建模,我们将该生成空间命名为 Real-world-Ready Skill Space,即依据高层级任务需求,我们可以从该空间中选取特定的技能与组合,进而实现稳定的全身控制。把复杂的多技能 sim2real 问题拆分成可解决的单技能 sim2real 问题,再利用层次结构与生成式建模把技能整合起来,仿真到真实(sim2real)迁移难题就不再可怕。具体来讲,该工作的技术核心包括以下三点:

  • 稳定秘诀——「真实世界稳定」的原子技能库

让机器人学会一种 skill 很难,让机器人学会多种 skills 更难,让机器人能够将学会的多种 skills 进行稳定的 sim2real transfer 更是难上加难。一般的端到端强化学习受限于优化难度和 sim2real transfer 稳定性,很难同时学会多种可在真实世界稳定运行的技能。

因此,本文提出首先通过基于启发式奖励函数的强化学习构建一个「真实世界稳定」的原子技能库。从功能性上设计出不同的原子技能,每个技能由专属的奖励函数训练,并通过 sim2real transfer 验证其在真实世界中的稳定性。

该工作将机器人的全身控制拆分为了三种不同的原子技能:locomotion、body-pose-adjustment 和 hand reaching。

Locomotion 负责让机器人健步如飞,body-pose-adjustment 支持机器人像人一样弯腰下蹲,hand-reaching 使得机器人双手可以精确触达目标点。

针对 locomotion,该工作使用步态引导产生稳定的行走动作:

针对 body-pose-adjustment,该工作鼓励在运动学和动力学上的对称性来实现稳定的机器人动作控制:

  • 化零为整——融合不同原子技能实现全身控制

分开训练虽然大大保证了原子技能在真实世界的表现,但是却不足以支撑真正的机器人全身控制,因为这需要机器人能够在不同技能之间协同、切换。因此,在原子技能库基础之上,该工作进一步提出一种 IL+RL 的技能融合策略,通过结合监督学习和强化学习的损失:

使得机器人能够同时掌握多种技能,并将其编码到一个技能隐空间当中,并通过 KL 散度和约束函数使得其空间更具结构性:

执行时,policy 只需要从隐空间解码,便可得到真实的关节力矩,在保留原子技能的真实世界稳定性的基础之上,实现原子技能之间的稳定组合与衔接,大幅扩展机器人的运动空间。

图注:从 a 到 d,机器人逐步解锁下蹲与前倾能力,机器人可触达空间逐步增大

  • 用途丰富——从全身遥操作到分层强化学习

该工作可以很好的支持全身遥操的需求,只需将遥操指令与机器人状态进行联合编码即可选取合适的技能组合并完成对机器人的稳定全身控制。此外,该工作也可以被应用在分层强化学习当中,帮助机器人自主完成一系列触达任务,例如基于环境感知的碰点、搬箱子等。

该工作发现,技能融合时得到的技能隐空间,是一个非常高效的关于机器人全身运动的表征方式,将高维无序的机器人动作编码为具有高度结构性的技能空间。高层规划策略只需要从该隐空间中采样,便能略去底层运动控制的细节,使得机器人以稳定的方式完成各种任务。该工作通过实验验证了其技能隐空间对于任务学习的有效性:

图注:不同方法在自主触点、自主搬箱任务中的对比,SR 代表成功率,DE 代表距离偏差

研究团队表示 OpenWBT 在持续更新中,在未来支持更多的机器人类型与更加复杂的技能类型,OpenWBT 项目也欢迎大家加入,持续招募全职工程师和实习生,期待全球开发者共同参与测试、优化,推动通用人形机器人技术发展。

相关内容

开源证券给予雷迪克买入评级...
每经AI快讯,开源证券6月13日发布研报称,给予雷迪克(30065...
2025-06-13 18:12:06
AI与机器人盘前速递丨南京...
【市场复盘】 周四(2025年6月12日),截至收盘,科创人工智能...
2025-06-13 11:12:10
推动灵巧操作技术普惠,灵心...
全球领先的灵巧手创新企业灵心巧手即将发布全新一代开源灵巧手。该款开...
2025-06-12 23:12:44
744分考上清华的庞众望现...
6月11日,九派新闻官博发文:近日,主持人@李小萌 讲述744的高...
2025-06-12 17:43:28
银河通用X清华大学发布首款...
该论文由清华大学与北京银河通用机器人有限公司合作完成。论文的共同第...
2025-06-12 17:11:39
Meta扎克伯格不满AI进...
2025-06-10 18:10:38

热门资讯

5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
支持 AI 扩图,华为 Pur... 2024-07-28 09:05:02作者:姚立伟 华为Pura 70 Pro手机今日推出鸿蒙Ha...
原创 A... 摘要:网易前高管创办(欢迎关注闺蜜财经) 撰文|蜜姐 这是@闺蜜财经的第1598篇原创 本周,北京...