在人工智能从“会说话”迈向“会行动”的关键拐点上,产业的竞争逻辑正在悄然改变。如果说大模型时代比拼的是算力、算法与语料,那么具身智能时代,决定上限的将不再只是模型能力,而是对真实世界的理解深度。

4月16日,京东集中发布具身智能数据基础设施,从采集终端到数据处理平台,再到具身大模型与数据交易体系,一口气打通“采、存、标、训、评、仿、测”全链路。这不是一次单点技术突破,而更像是一次基础设施级的重构:把原本分散、低效、难以复用的人类行为数据,转化为可规模生产、可标准流通、可持续迭代的“工业化数据燃料”,并试图以此为核心,推动具身智能从实验室走向产业化落地。
从“数据稀缺”到“数据工业化”:具身智能真正的门槛正在被重写
具身智能过去几年发展缓慢,一个被反复验证的事实是:问题并不在算法,而在数据。与自然语言不同,机器人需要理解的是三维空间、物体交互以及连续动作,这些能力无法仅靠互联网数据训练获得,而必须依赖大量真实世界中的操作样本。然而现实却是,行业长期处于“有场景、没数据;有数据、不可用”的尴尬状态。一方面,物流、制造、医疗、家庭等场景中每天都在产生海量操作行为,但由于采集设备标准不统一、数据格式不一致,这些数据往往碎片化存在;另一方面,即便采集到视频或传感器数据,也往往缺乏结构化标注与语义理解,无法直接进入模型训练流程,最终形成大量“沉睡数据”。
这种结构性瓶颈,使得具身智能的发展远落后于语言模型。机器人看似拥有视觉与运动能力,却无法稳定完成最基础的任务,本质上是因为“见得太少、学得太浅”。行业共识逐渐清晰:不是机器人不够聪明,而是缺乏高质量、可用、可规模化的真实数据。
京东此次的切入点,正是将数据问题从“研究问题”转化为“工程问题”。通过构建覆盖全链路的数据基础设施,它试图把原本零散的数据生产过程,改造成类似工业流水线的体系:从源头采集开始,统一设备与标准;进入云端后,通过自动化清洗、对齐、预标注形成标准数据集;再通过仿真平台扩展长尾场景,最终进入模型训练与测试环节,形成闭环。这种体系的关键不在某一个环节的技术领先,而在于“打通”,让数据从产生到使用不再断裂。
更具冲击力的是其规模化策略。京东提出将在两年内组织60万人参与数据采集,累计获取1000万小时真实场景视频。这意味着,数据不再依赖少量专业团队,而是通过大众化参与实现指数级增长。普通人通过可穿戴设备即可完成采集,真实世界的操作行为被持续记录与结构化处理,从而转化为机器可以学习的素材。数据从“稀缺资源”转变为“可生产资源”,这一步变化,类似当年云计算将算力从昂贵资产变为可按需获取的基础能力,一旦形成规模,将直接抬高整个行业的技术天花板。
从“模型驱动”到“数据驱动”:效率革命如何改变产业节奏
在具身智能领域,另一个长期困扰行业的问题是开发效率极低。传统路径中,一个机器人模型的训练往往需要经历冗长流程:人工筛选数据、反复标注、手动调参、离线仿真测试,再到真机验证,每一步都高度依赖人工经验,不仅成本高昂,而且周期漫长。这种“手工作坊式”的开发方式,使得具身智能难以快速迭代,更无法支撑大规模商业落地。
京东试图通过平台化能力重构这一流程。其AI数据湖平台可以实现PB级数据吞吐,对采集数据自动完成清洗、对齐与结构化处理,将原始视频转化为可训练的数据集;JoyBuilder仿真平台则通过高逼真环境生成补充数据,尤其针对长尾场景进行扩展,使模型能够在更多极端或低频情况下保持稳定表现;在模型开发层面,通过统一平台实现“开箱即训”“一键部署”,显著降低工程复杂度。
这些能力叠加带来的结果,是训练效率提升3.5倍、数据处理成本降低60%。数字本身或许只是阶段性成果,但其背后的意义更值得关注:当训练效率被大幅提升,模型迭代速度将同步加快,行业竞争将从“谁能做出来”,转变为“谁迭代更快”。这与互联网产品的竞争逻辑高度相似——快速试错、持续优化,而不是一次性完成。
与此同时,数据与模型之间形成了正向循环。高质量数据可以提升模型精度,而更强的模型又可以反向参与数据标注与筛选,进一步降低人工成本、提高数据质量。这种“数据—模型”双向强化的飞轮一旦建立,将带来持续的效率提升与成本下降,使得具身智能逐渐具备规模化扩张的基础。
在这一体系中,JoyAI-RA模型的73.5%真机成功率尤为关键。在具身智能领域,成功率的提升并非线性意义上的优化,而往往意味着可用性的质变。当模型在真实环境中的稳定性接近商业应用门槛时,机器人不再只是展示技术能力的工具,而开始具备实际生产价值。换句话说,这一阶段的竞争重点,已经从“能否实现”转向“是否可靠”。
从“技术突破”到“产业生态”:数据流通如何成为决定性变量
如果说数据采集与处理解决的是供给问题,那么数据流通则决定了整个产业能否真正繁荣。长期以来,具身智能数据存在明显的“孤岛效应”:企业各自采集、各自使用,缺乏统一标准与交易机制,导致资源无法共享,重复投入严重,整体效率低下。这种封闭模式在早期尚可维持,但在需要大规模数据支撑的阶段,将成为制约行业发展的关键障碍。
京东推出的数据交易平台,正是针对这一问题的系统性回应。通过聚合多场景、多模态数据资源,平台允许数据提供方、模型开发者与应用企业在统一框架下协同,同时引入全链路安全审计机制,确保数据在合规前提下流通。这一设计,本质上是将数据从“内部资产”转化为“市场资源”,使其具备可定价、可交易、可复用的属性。
这一步的战略意义,甚至不亚于前端技术突破。因为一旦数据能够流通,行业的参与门槛将显著降低,中小企业无需从零开始构建数据体系,而可以通过购买或交换数据快速进入赛道;同时,大企业的数据优势也可以通过平台放大,形成规模效应。最终,具身智能有望像云计算一样,形成以平台为核心的生态体系。
在这一背景下,京东提出“具身智能超级供应链”的概念并非简单延伸,而是对自身能力的再定义。从零售、物流到工业与医疗,京东原有业务积累了大量高频、真实且可重复的操作场景,这些场景不仅是商业资源,更是数据来源。当这些数据被系统化处理并进入流通体系后,京东的角色也随之变化:从商品流通平台,转变为“能力输出平台”,向外提供数据、模型与服务。
进一步看,这种转变也意味着产业分工的重塑。未来的机器人企业,可能不再需要自建完整的数据体系,而是像调用云服务一样,直接使用平台提供的数据与模型能力;应用企业则可以基于成熟模型快速部署机器人解决方案,而不必深入底层技术。整个产业链将从“纵向一体化”走向“横向协同”,效率与创新速度都会显著提升。
从更长周期看,具身智能的竞争核心正在发生转移。算力可以购买,算法可以开源,但真实世界的数据却难以复制。谁能更高效地采集、处理并利用这些数据,谁就更有可能在下一轮技术浪潮中占据主导位置。京东此次构建的,不只是一个技术体系,而是一种新的生产范式:让人类行为被记录、被理解、被复用,最终转化为机器能力。当数据开始像能源一样被开采与流通,具身智能也将不再停留在概念阶段,而真正进入规模化应用的临界点。

维端网





