> 数据图表谁知道4.2 合成数据作为新衍生赛道,潜在市场空间巨大
2025-5-14.2 合成数据作为新衍生赛道,潜在市场空间巨大 所谓合成数据,即是用AI生成数据而非真实产生,能够替代真实数据来训练、测试和验证大模型。目前主要在自动驾驶、机器人、生物医药等领域应用。MIT发布的一项研究指出,高质量的数据可能会在2026年消耗殆尽,因此行业基本都转向使用AI产生的合成数据训练模型,以期突破数据瓶颈。OpenAI CEO Sam也曾说未来所有的数据都将变成合成数据。 量子位智库预计,合成数据将成为未来增速最快赛道,年增长率可达45%。图:合成数据优势明显且可应用场景多元化合成数据优势&特点应用场景1. 降本增效降低数据获取成本,生成数据自带高质量标注,缓解“数据荒”问题;2.数据可定制应用可扩展性强,灵活度高,可覆盖多边缘、长尾场景;19453.隐私安全天然规避掉数据隐私安全合规问题数据增强模型验证模型验证自动驾驶机器人金融、生物医药具身智能AR/VR…资料来源:量子位智库,华西证券研究所36