> 数据图表请问一下数据质量:首个具身智能数据集标准发布
2025-6-3数据质量:首个具身智能数据集标准发布➢ 具身智能数据质量把控是重要一环。具身智能开发和验证所需的数据集包括任务语言描述、场景语义、3D空间、本体状态、运动轨迹、视触感知等多模态、强异构的数据,涉及不同的数据采集设备和数据获取方式,且需要经过多阶段的数据处理,因此对数据质量的把控是很重要的一个环节。➢ 中国信通院人工智能研究所依托中国人工智能产业发展联盟(AIIA)具身智能工作组,并联合行业34家单位共同编制了《具身智能数据集质量要求及评价方法》,以推动大规模、高质量的具身智能数据集建设,助力具身智能技术创新和产业生态发展。➢ 首个具身智能数据采集标准发布。2024年11月,国家地方共建具身智能机器人创新中心牵头立项《人工智能 具身智能 数据采集规范》工信部行业标准,这是国内第一个具身智能数据集的行业标准,规范了具身智能数据集采集的格式,使不同公司采集的数据可以互相共享开源,能够加速模型“涌现”。创新中心未来还将设计一系列数据集标准,为模型泛化保驾护航。➢ 2024年12月,创新中心正式发布了《具身智能标准化研究报告》、《具身智能数据集及评测研究报告》(即RoboMIND)两项重磅报告,为行业的标准化与数据集建设提供指引。具身智能数据集采集标准的建立将进一步明确具身智能数据要求及质量等,从而加速具身智能行业的良性发展。图:具身智能数据集质量要求及评价框架数据来源:群核科技,东吴证券研究所8