> 数据图表怎样理解DeepSeek 爆火时间线梳理(2025 年)
2025-6-0
在今年 1 月 20 日,深度求索(DeepSeek)正式发布 DeepSeek R1 模型。其在较短时间内获得巨大流量和关注(图表 1),再次引燃 AI 大模型行业的市场关注。自 2022 年年底 ChatGPT 3.5 发布以来,DeepSeek 可能是对 AI 大模型行业最重要的推动力量之一。 首先,DeepSeek 的通用模型 V3 和推理模型 R1 均具备比肩头部 AI 大模型 的性能。根据 DeepSeek,其 V3 在数学、编程等能力测试上超过 GPT-4o 的 能力(图表 4),在多语言多任务、研究生能力测试、软件等能力方面也与头部模型能力接近,好于优秀的其他开源模型。今年年初以来,其大幅吸引流量的 DeepSeek-R1 的模型能力与 V3 比较类似,在数学、编程的能力超过OpenAI-o1,而其余能力也接近最强模型的能力,优于中部排名的模型能力。 其次,DeepSeek 的成本也大幅低于其性能可比的 AI 大模型。OpenAI、字节、阿里等 AI 大模型这两年的价格符合这一基本趋势(图表 5)。DeepSeek 的出现大大加速了行业成本下行的速度。例如,DeepSeek-R1 的 API 定价,每百万 token 的输出价格为 2.19 美元,比起 OpenAI o1 的 60 美元低了 90%以上,比 OpenAI o3-mini 性价比模型的价格的 4.40 美元也便宜了一半。 所以,我们看到 DeepSeek 通过其自身的技术路径可以实现更低的使用成本,低于 OpenAI、谷歌、Meta 等海外竞争模型。新的技术路径在实现单位算力使用量价格下降的同时,也带动真正的需求端,尤其是企业需求端的成本下降,从而大幅促进 AI 大模型需求的扩张。因此,在较短的时间,较多厂商就将 DeepSeek 引入到自己的平台中,包括云服务平台、搜索、手机、汽车等行业(图表 2)。甚至于,腾讯等通用 AI 大模型厂商也将 DeepSeek 作为选项之一接入到自身平台中(图表 3)。 性能飞速提升以及成本大幅下降,这符合新兴技术行业发展初期的特性。从下半年展望来看,AI 大模型行业仍然会见到通用 AI 大模型或底层 AI 大模型不断涌现,在性能和成本两个维度在持续推动行业进步。例如,今年 3 月发布的 Grok-3.0 则在部分指标的表现上优于面世不久的 DeepSeek V3。近期,小米推出的自研推理大模型 MiMo-VL 在多个能力维度也有较好体现。 从更长期的维度看,AI 大模型行业将带动科技产业发展。AI 大模型的算力、模型、下游应用都将迎来更加蓬勃的发展。