在具身智能这一软硬件深度耦合的前沿领域,构建一个高质量的开源基础模型底座,是加速整个行业生态繁荣的坚实“地基”,也是实现机器人在物理世界大规模、稳定交互的关键。
当前,机器人模型的验证链路冗长,行业里专用小模型、通用大模型质量参差不齐;基础模型、专用模型、微调模型鱼龙混杂;且缺乏统一的评价标准;开源是拨开迷雾、推动行业标准化和成熟化的必由之路。
自变量的自研端到端具身智能基础模型WALL-OSS自开源以来,迅速获得了全球开发者的广泛关注与应用。在我们的开源社区中,多元背景的开发者们活跃互动,针对复现问题展开深入交流,自变量技术团队亦坚持在一线提供及时的技术支持。
同时,为进一步展示模型的真实性能并降低复现门槛,我们此前也将WALL-OSS接入了RoboChallenge平台——这一全球首个大规模、多任务的,在真实物理环境中的真机评测平台,以开放透明的态度接受检验,赋能更多开发者。
近日,RoboChallenge在完成相应接口调试工作后,呈现了最新的模型测试结果,榜单总分和成功率前三都依次是pi0.5、WALL-OSS、pi0,三者均已开源,WALL-OSS是其中唯一一个国内开源具身基础模型。
具体来看,WALL-OSS在真实世界中的叠洗碗巾、按按钮、浇盆栽等多个长序列复杂任务中得分第一。
并且WALL-OSS目前提交的复现结果示例,微调代码和模型权重也将在近期全部开源,让模型展现出的泛化能力、推理能力等有据可查。除了检验测试结果的真实性,开发者们也可以在平台上根据源代码和各个任务的微调代码,结合自己的数据完成复现微调。
长期以来,具身智能的难点和痛点在于尚未形成一个统一的评测标准,供大家尽可能低成本、且比较公平地评测模型,观察其在真实环境的泛化能力、鲁棒性等。
一个在真实世界公开透明的决斗场对不同的开发者而言至关重要,一方面,模型的能力需要真实全面地呈现在“太阳底下”,才能供开发者们自由选择,真正起到评测鉴伪的作用;另一方面,高质量的基础模型才能有效避免“重复造轮子”,将有限资源集中于核心突破。
自变量从成立以来,就致力于树立开源的标杆,让每次开源都对行业产生价值,并展现我们的思路和探索,弥补技术空白。通过开源来成为核心基础设施的技术引领者,凝聚更多优秀开发者的智慧,在一些关键问题上一起攻坚突破,推动行业前行发展。
以WALL-OSS为开端,我们并不是简单地提供一个模型,而是一整套完整可复现的方案,包括预训练模型权重、训练代码、数据集接口,以及详细部署文档等。随着越来越多的开发者复现,我们也将一位开发者自发撰写的复现文档分享在了社群中,供大家参考利用。
此前,自变量机器人联合创始人&CTO王昊也在硅谷101播客中明确表达了自变量的初衷——
“我一直都觉得开源是非常重要的事情,开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。
一般的高校、或者一些小型的企业,他们可能没有能力去做基础模型,但是如果能够使用这些基础开源模型,他们就可以去做应用,把它用到各个方向,丰富整个生态,这也是一个非常重要的事情。
AI的研究我觉得跟大模型之前有很大不一样。过去,我们可以看到AI和大模型的研究是非常离散的,在真正形成一个社区之前,可能做研究的只有两、三个人,大家疯狂地研究一个算法,更多是以论文发表作为第一要务,目的是占据技术的主动权。
但有了社区和整个开源体系之后,大家更在乎的是,怎么在一个工程化的体系下,把这个工程基础打好,让这个社区更加繁荣?个人是通过什么方式给社区做贡献?大家的荣誉反而来自于这样的事情。这样也就会促使开源模型的技术不停地发展。所以我觉得开源是一个非常好的事情,既可以从中学习到新的东西,也可以看到你的东西可能对别人有帮助。”(来源:硅谷101)
开源首先意味着透明与验证。当模型代码、训练数据乃至架构设计公之于众时,任何夸大或不实都将被全球开发者社区置于放大镜下检验。每一次复现、每一次部署都是一场严格的压力测试,任何夸大、虚假的演示都无处遁形,也将推动建立以真实性能而非商业包装为标准的评价体系,促使行业竞争从营销噱头回归技术本身。
具身发展需要开源凝聚创新力量。未来,具身智能的落地,需要“大脑”(具身基础模型)与“身体”(机器人硬件)紧密协同,其中涉及大模型、机器人学、强化学习等多个前沿领域。开源社区让全球研究者可协作攻关,加速跨领域知识融合。开放协作的“集体智慧”,远比封闭开发更能有效应对真实世界的复杂性、随机性。
拥抱开源,以透明对抗虚假,以协作替代闭门造车。这不仅是对技术的开放、尊重和敬畏,更是对行业未来的开拓、负责和担当。唯有如此,具身智能才能从实验室走向现实世界,真正惠及千行百业。
欢迎更多开发者参与到WALL-OSS模型的复现中,有更多关于模型及复现的问题欢迎加入我们的开源社群,一起交流探讨,获取最新解答!