机器人也能开抽屉抽纸巾?Meta联合开发机器人AI模型,任务成功率达90%
创始人
2024-09-21 21:50:06
0

在机器人技术领域,让机器人在从未见过的环境中执行任务一直是一个棘手的问题。

一般来说,研究人员需要针对每个新环境对机器人进行额外的训练,这个过程既耗时又昂贵。然而,最近的一项新研究为解决这一难题带来了新的希望。

美国纽约大学、Meta 和机器人公司 Hello Robot 的研究团队开发了一系列 AI 模型,称为机器人实用模型(Robot Utility Models,RUMs)。

这些模型能够教导机器人在全新的环境中完成基本任务,而无需进一步的训练或微调。

研究团队训练了五个 RUMs,分别用于执行开门、开抽屉、拾取纸巾、拾取纸袋以及重新摆正圆柱形物体等任务。令人惊喜的是,这些模型在未知环境中的平均成功率高达 90%。

RUMs 的核心优势在于其零样本学习能力。这意味着机器人可以直接推广到新环境中,而无需任何额外的调整。

纽约大学博士生马希·沙菲乌拉(Mahi Shafiullah)表示,这项研究聚焦于“如何教会机器人在任何地方打开任何门”。

图 | 正在打开抽屉的机器人(来源:RUM 网站)

创建高效的 RUMs 涉及几个关键步骤:

首先是数据收集。为了加快收集机器人学习新技能所需的数据,研究团队使用了一种创新方法:将 iPhone 固定在便宜的拾取器上。依靠着这个简易设备,他们在 40 个不同环境中(包括纽约市和泽西市的家庭里)为每个任务录下了约 1000 次演示。

随后,研究人员使用了五个数据集训练机器学习算法,创建了五个 RUM 模型。这些模型被部署在名为 Stretch 的机器人上进行测试。Stretch 由一个轮子、一根高杆和一个可伸缩的手臂组成,手臂上安装了一部 iPhone。

在测试中,机器人最开始的任务完成率仅为 74.4%,研究人员通过使用 OpenAI 的 GPT-4o 大语言模型进行自我检查和重试,将成功率提高到了 90%。

这项研究所展示的 RUMs 模型展示了其在不同环境和任务中的广泛适用性。同时,通过使用廉价的商用机器人和普通智能手机,它证明了表现优秀的自动化系统不一定需要昂贵的硬件。

研究人员表示,在现实世界中,这样的零样本学习能力可以大大减少在新环境中部署机器人所需的时间和资源。此外,利用大模型进行自我检查和错误纠正,也展示了 AI 技术之间的协同效应。

图 | RUMs 模型是如何构建的(来源:RUMs 网站)

莫希特·什里达尔(Mohit Shridhar),是英国帝国理工学院一位专门研究机器人操作的科学家。

他评论道:“能看到它在这些多样化的家庭和厨房中进行评估是非常好的一件事,因为如果你能让机器人在任何一间房子里工作,这是机器人技术想要实现的真正目标。”

尽管 RUMs 取得了一些进步,但研究人员也指出了一些挑战和改进空间。

例如,数据收集效率仍然有较大限制。虽然已经开发了新工具来加速数据收集,但进一步提高效率仍然是一个重要目标。

此外,如何在更极端的环境变化下保持高表现仍需探索,任务的复杂性也有待进一步提升。随着机器人能力的提升,我们还需要更多关注安全性和道德问题。

沙菲乌拉展望了 RUMs 的未来应用:“我们的梦想是,我可以训练一个模型,将其放到互联网上,而你应该能够下载并在你家里的机器人上运行它。”

这个愿景不仅可以作为构建其他实用机器人模型的通用方法,还能以最少的成本教会机器人新技能,使未经过专业训练的普通人也能在家中部署机器人。

为了推动 RUMs 在更广泛的任务中的应用,研究团队已经开源了他们的代码、数据、模型、硬件设计以及实验和部署视频。这一举措将有助于全球研究人员进一步探索和改进这一技术。

总的来说,这些新模型(RUMs)代表了机器人学习和适应能力的一个重要突破。通过实现零样本环境适应,RUMs 为机器人在复杂多变的现实世界中的应用开辟了新的可能性。

这项技术不仅可能改变我们与机器人互动的方式,还可能加速机器人技术在日常生活中的普及。

随着技术的不断进步和更多研究的投入,我们可以期待看到更多智能、灵活且易于部署的机器人系统在各个领域发挥作用,从而推动自动化技术向前发展。

参考资料:

https://robotutilitymodels.com/

https://www.technologyreview.com/2024/09/20/1104233/ai-models-let-robots-carry-out-tasks-in-unfamiliar-environments/

排版:溪树

相关内容

“巴别鱼”梦想落地 “深圳...
南方财经记者吴佳楠 深圳报道 近期,在一场比赛的聚光灯下,AI与人...
2025-07-12 19:11:28
香港维尔利与联合国健康技术...
香港维尔利健康科技集团正式宣布,已与联合国健康技术基金(Unite...
2025-07-12 15:13:30
看了AI生成的ASMR吃播...
前段时间,一条用 AI 生成的切水果 ASMR 短视频,在洋抖上爆...
2025-07-12 13:13:44
上海AI实验室团队:如何优...
这项由上海AI实验室和复?dan大学联合开展的突破性研究发表于20...
2025-07-12 13:13:26
告别“无效阅读”,AI正在...
学校管理者为零散的阅读活动、无法量化的成果而苦恼; 一线教师在“选...
2025-07-12 12:42:00
月之暗面Kimi K2发布...
月之暗面今天宣布,正式发布Kimi K2模型,并同步开源。Kimi...
2025-07-12 06:12:21

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...