> 数据图表怎样理解1.2 指南引领地方实践,高质量数据集赋能AI能A2025-5-21.2 指南引领地方实践,高质量数据集赋能AI能An 2025年4月30日,全国数标委发布《高质量数据集建设指南(征求意见稿)》图表5:高质量数据集建设方法等技术文件,面向社会公开征求意见。这是国内首个国家层面的高质量数据集建设指南。n 人工智能对于高质量场景数据集的需求尤为突出。2024年《政府工作报告》首次将“人工智能+”上升至国家战略层面,明确提出深化大数据、人工智能等研发应用。生成式人工智能所采用的预训练方法是通过海量数据的累积效应实现模型的智能涌现与能力迁移。一方面,预训练模式对于模型专业领域的性能提升效果欠佳,未经筛选的低质量数据容易导致专业性问题的“模型幻觉”(模型生成了不符合事实或毫无根据的信息);另一方面,预训练所需的可用数据资源即将被用尽。在双重挑战的协同作用下,针对特定场景的高质量数据集成为人工智能模型训练的关键支撑,为现有数据局限下智能模型的训练路径优化提供转向可能。特定领域的高质量数据注入能够推动人工智能掌握对应领域的关键特征与独有规律,通过垂直场景的上下文关系增强模型训练的精准性与针对性,实现高度专业化与个性化的人工智能解决方案与创新拓展。n 未来,更多专业维度的高质量场景数据集将助推人工智能于更宽广的重点领域展现“专家级”能力,实现模型性能与社会效率的场景化跃升。请参阅附注免责声明资料来源:数据要素社,中邮证券研究所8中邮证券综合其他