> 数据图表

谁知道具身智能浪潮来袭,数据供给瓶颈亟待突破

2025-6-3
谁知道具身智能浪潮来袭,数据供给瓶颈亟待突破
具身智能浪潮来袭,数据供给瓶颈亟待突破➢ 数据是推动具身智能技术快速突破和落地应用的关键。借鉴自动驾驶汽车发展的路径,数据对于具身智能同样至关重要。优质的数据集能够驱动智能体感知与理解环境,能够加速具身智能模型的训练与部署,帮助机器人有效完成复杂任务。➢ 目前高质量、多样化的数据集仍旧稀缺。不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型没有现成数据可以使用,需要投入大量时间和资源进行机器人操作实践或仿真模拟,以收集视觉、触觉、力觉、运动轨迹以及机器人本体状态等多源异构数据。符合通用标准、得到验证的数据集成为具身智能行业的刚需。当前具身智能本体形态多种多样,应用场景千差万别,对于具身智能训练数据的需求也更为多元。目前业内仍有部分数据集主要聚焦在特定机器人、特定场景和特定技能等方面,在整体通用性上有待提升。因此,构建高质量、多样化的感知数据集是不可或缺的基础工作,这些数据集不仅为算法训练提供了丰富的素材,也成为了评估具身性能的基准参考标准。➢ 数据集的标准和有效也同样重要。作为训练具身智能大模型的重要原料,数据集采集是否符合标准、在训练上是否“能用”、“好用”,是否能更有效支持模型泛化,已经成为机器人变“聪明”的关键。图:具身智能大脑整体框架数据来源:生境科技,东吴证券研究所5