训练效率提升3.5倍!京东云率先支持具身智能千卡开源训练框架
创始人
2025-12-08 11:15:21
0

近日,京东云JoyBuilder模型开发平台迎来全新升级,成功支撑业界顶尖模型GR00T N1.5的千卡训练,成为行业首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台,且训练效率较开源社区版本提升3.5倍。基于软硬件深度调优和算法层面的突破,大幅提升了模型训练效率与稳定性,1亿+数据的千卡训练时间从15小时缩短至22分钟,加速具身智能迈向规模化落地。

1、JoyBuilder三大优势,全面加速具身智能模型训练

近年来,具身智能成为AI领域的重要研究方向,但训练一个高效的具身模型,需要同步处理图像、文本和连续动作信号等众多环节,在工程落地方面存在着数据供给读取慢、算力效率低下,以及数据预处理和存储I/O与GPU计算等多个环节未能有效协同产生的性能瓶颈,是具身智能从实验室走向规模化落地的最大挑战。

围绕具身智能模型训练,京东云AI Infra及相关团队基于JoyBuilder模型研发平台进行了全栈优化:

在具身数据链路优化方面,通过重构具身数据预处理与加载流程,JoyBuilder平台实现CPU数据处理与GPU计算异步执行,减少等待时间。针对海量具身小数据文件,自研的高性能并行文件系统云海JPFS通过分布式元数据管理与智能预取,支持高并发访问。在1024卡集群上,读取带宽超过400GB/s,保障数据持续高速供给。

在具身模型计算优化方面,针对主流开源的VLA(视觉-语言-动作)模型的计算特点从Attention层、Token裁剪和训练后量化等多方位极致优化,全方位提升模型的训练效率。

在具身模型基础设施方面:通过搭建3.2T RDMA后端网络,基于多轨道优化、拓扑感知调度与智能震荡抑制,保障千卡间集合通信的高吞吐与低延迟,并在单点故障时快速恢复,支持长周期训练稳定运行。同时,基于云原生的AI数据湖优化了数据调度与流水线,提升端到端处理效率。

2、行业首家支持具身模型千卡级开源训练框架

具身智能的发展依赖于算法、数据、算力及基础设施的系统化协同,京东云JoyBuilder模型开发平台,基于在全链路数据处理、模型计算效率和AI基础设施等的全面优化,支持业界当前最主流的LeRobot训练数据最新协议,并成为行业首家支持具身模型千卡级开源训练框架的AI开发平台。

首先,支持业界最广泛的训练数据新协议。早期LeRobot V2.1数据协议采用“单 episode 单文件”设计,大规模样本训练时,海量小文件易导致数据加载瓶颈和存储压力。京东云JoyBuilder平台支持一键升级至“多 episode 合并分片”的V3协议,同时解决原生框架训练过程中数据链路低效问题,经过并行流水线和高效索引查询优化,将训练数据供给速度提升超10倍,显著提升云侧算力利用率和训练效率,满足大规模分布式训练需求。

其次,作为行业首家支持具身模型千卡级的开源训练框架的AI开发平台,京东云JoyBuilder基于开源LeRobot框架,首次实现GR00T模型的千卡分布式高效训练,训练效率较开源社区版本提升3.5倍,1亿+数据千卡训练时间从15小时缩短至22分钟、提速40倍,大幅降低了千卡训练的使用门槛与运行成本。

第三,基于对主流开源具身VLA模型效率的极致优化,采用动态计算优化,引入变长Flash-Attention与Data Packing技术、训练提速188%;仅对有效token进行计算,减少填充带来的算力损耗,Token裁剪优化训练提速165%以上;使用训练后细粒度FP8量化,在基本保持模型精度前提下,将权重压缩超过36%、提速140%以上。

当前,基于京东集团复杂场景实践,京东云已经构建了一站式大模型产品矩阵,从底层的智算基础设施,到中间层的模型服务和工具,再到上层的Agent应用开发,支持具身智能企业快速部署大模型及AI应用,共同推动机器人更好地理解和服务物理世界,开启人机协作的新篇章。

来源:金融界资讯

相关内容

智谱GLM-4.6V系列多...
IT之家 12 月 8 日消息,智谱 AI 今日官宣发布并开源 G...
2025-12-08 20:15:56
服装行业退货率高,问题出在...
近日,一家服装潮牌代工厂借助AI快速上新的案例,引发了争议。 不再...
2025-12-08 18:46:22
瞭望 | AI4S重塑科研...
在积极利用AI提升知识积累效率的同时,我们需审慎思考,如何确保科学...
2025-12-08 18:16:14
从“工具”到“体验”:企业...
过去几年,中国数字经济迈入高速迭代期。无论是人工智能的产业应用,还...
2025-12-08 16:15:41
中信建投:AI大模型与应用...
瑞财经 严明会 近日,中信建投指出,DeepSeek V3.2发布...
2025-12-08 15:17:11
自变量机器人参与成立Rob...
2025年深圳国际人工智能展览会上,一台名为“小量”的机器人正有条...
2025-12-08 14:16:12

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...