让开源生态评价开源模型!
创始人
2026-01-12 15:46:33
0

在具身智能这一软硬件深度耦合的前沿领域,构建一个高质量的开源基础模型底座,是加速整个行业生态繁荣的坚实“地基”,也是实现机器人在物理世界大规模、稳定交互的关键。

当前,机器人模型的验证链路冗长,行业里专用小模型、通用大模型质量参差不齐;基础模型、专用模型、微调模型鱼龙混杂;且缺乏统一的评价标准;开源是拨开迷雾、推动行业标准化和成熟化的必由之路。

自变量的自研端到端具身智能基础模型WALL-OSS自开源以来,迅速获得了全球开发者的广泛关注与应用。在我们的开源社区中,多元背景的开发者们活跃互动,针对复现问题展开深入交流,自变量技术团队亦坚持在一线提供及时的技术支持。

同时,为进一步展示模型的真实性能并降低复现门槛,我们此前也将WALL-OSS接入了RoboChallenge平台——这一全球首个大规模、多任务的,在真实物理环境中的真机评测平台,以开放透明的态度接受检验,赋能更多开发者。

超越pi0,多项单任务得分排名第一

近日,RoboChallenge在完成相应接口调试工作后,呈现了最新的模型测试结果,榜单总分和成功率前三都依次是pi0.5、WALL-OSS、pi0,三者均已开源,WALL-OSS是其中唯一一个国内开源具身基础模型。

具体来看,WALL-OSS在真实世界中的叠洗碗巾、按按钮、浇盆栽等多个长序列复杂任务中得分第一。

并且WALL-OSS目前提交的复现结果示例,微调代码和模型权重也将在近期全部开源,让模型展现出的泛化能力、推理能力等有据可查。除了检验测试结果的真实性,开发者们也可以在平台上根据源代码和各个任务的微调代码,结合自己的数据完成复现微调。

长期以来,具身智能的难点和痛点在于尚未形成一个统一的评测标准,供大家尽可能低成本、且比较公平地评测模型,观察其在真实环境的泛化能力、鲁棒性等。

一个在真实世界公开透明的决斗场对不同的开发者而言至关重要,一方面,模型的能力需要真实全面地呈现在“太阳底下”,才能供开发者们自由选择,真正起到评测鉴伪的作用;另一方面,高质量的基础模型才能有效避免“重复造轮子”,将有限资源集中于核心突破。

坚持开源,做“提供肩膀的巨人”

自变量从成立以来,就致力于树立开源的标杆,让每次开源都对行业产生价值,并展现我们的思路和探索,弥补技术空白。通过开源来成为核心基础设施的技术引领者,凝聚更多优秀开发者的智慧,在一些关键问题上一起攻坚突破,推动行业前行发展。

以WALL-OSS为开端,我们并不是简单地提供一个模型,而是一整套完整可复现的方案,包括预训练模型权重、训练代码、数据集接口,以及详细部署文档等。随着越来越多的开发者复现,我们也将一位开发者自发撰写的复现文档分享在了社群中,供大家参考利用。

此前,自变量机器人联合创始人&CTO王昊也在硅谷101播客中明确表达了自变量的初衷——

“我一直都觉得开源是非常重要的事情,开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。

一般的高校、或者一些小型的企业,他们可能没有能力去做基础模型,但是如果能够使用这些基础开源模型,他们就可以去做应用,把它用到各个方向,丰富整个生态,这也是一个非常重要的事情。

AI的研究我觉得跟大模型之前有很大不一样。过去,我们可以看到AI和大模型的研究是非常离散的,在真正形成一个社区之前,可能做研究的只有两、三个人,大家疯狂地研究一个算法,更多是以论文发表作为第一要务,目的是占据技术的主动权。

但有了社区和整个开源体系之后,大家更在乎的是,怎么在一个工程化的体系下,把这个工程基础打好,让这个社区更加繁荣?个人是通过什么方式给社区做贡献?大家的荣誉反而来自于这样的事情。这样也就会促使开源模型的技术不停地发展。所以我觉得开源是一个非常好的事情,既可以从中学习到新的东西,也可以看到你的东西可能对别人有帮助。”(来源:硅谷101)

开源首先意味着透明与验证。当模型代码、训练数据乃至架构设计公之于众时,任何夸大或不实都将被全球开发者社区置于放大镜下检验。每一次复现、每一次部署都是一场严格的压力测试,任何夸大、虚假的演示都无处遁形,也将推动建立以真实性能而非商业包装为标准的评价体系,促使行业竞争从营销噱头回归技术本身。

具身发展需要开源凝聚创新力量。未来,具身智能的落地,需要“大脑”(具身基础模型)与“身体”(机器人硬件)紧密协同,其中涉及大模型、机器人学、强化学习等多个前沿领域。开源社区让全球研究者可协作攻关,加速跨领域知识融合。开放协作的“集体智慧”,远比封闭开发更能有效应对真实世界的复杂性、随机性。

拥抱开源,以透明对抗虚假,以协作替代闭门造车。这不仅是对技术的开放、尊重和敬畏,更是对行业未来的开拓、负责和担当。唯有如此,具身智能才能从实验室走向现实世界,真正惠及千行百业。

欢迎更多开发者参与到WALL-OSS模型的复现中,有更多关于模型及复现的问题欢迎加入我们的开源社群,一起交流探讨,获取最新解答!

相关内容

瞭望 | 警惕“AI魔改”...
文 | 张欣 翟天旸 自2026年1月1日起,国家广播电视总局在全...
2026-01-12 16:47:17
普联软件:智能体开发平台支...
证券之星消息,普联软件(300996)01月12日在投资者关系平台...
2026-01-12 16:17:32
让开源生态评价开源模型!
在具身智能这一软硬件深度耦合的前沿领域,构建一个高质量的开源基础模...
2026-01-12 15:46:33
AI应用板块热度持续高涨,...
1月12日午盘,AI应用板块热度持续高涨,同指数规模最大的游戏ET...
2026-01-12 14:46:50
具身智能DeepSeek时...
智东西 作者 | 程茜 作者 | 漠影 智东西1月12日报道,今日...
2026-01-12 14:46:39
传音荣获 CES 2026...
近日,在 CES 2026 国际消费类电子产品展览会期间,微软大中...
2026-01-12 12:46:25

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...