一起讨论下DeepSeek 爆火时间线梳理（2025 年）

> 数据图表

一起讨论下DeepSeek 爆火时间线梳理（2025 年）

2025-6-0

在今年 1 月 20 日，深度求索（DeepSeek）正式发布 DeepSeek R1 模型。其在较短时间内获得巨大流量和关注（图表 1），再次引燃 AI 大模型行业的市场关注。自 2022 年年底 ChatGPT 3.5 发布以来，DeepSeek 可能是对 AI 大模型行业最重要的推动力量之一。首先，DeepSeek 的通用模型 V3 和推理模型 R1 均具备比肩头部 AI 大模型的性能。根据 DeepSeek，其 V3 在数学、编程等能力测试上超过 GPT-4o 的能力（图表 4），在多语言多任务、研究生能力测试、软件等能力方面也与头部模型能力接近，好于优秀的其他开源模型。今年年初以来，其大幅吸引流量的 DeepSeek-R1 的模型能力与 V3 比较类似，在数学、编程的能力超过OpenAI-o1，而其余能力也接近最强模型的能力，优于中部排名的模型能力。其次，DeepSeek 的成本也大幅低于其性能可比的 AI 大模型。OpenAI、字节、阿里等 AI 大模型这两年的价格符合这一基本趋势（图表 5）。DeepSeek 的出现大大加速了行业成本下行的速度。例如，DeepSeek-R1 的 API 定价，每百万 token 的输出价格为 2.19 美元，比起 OpenAI o1 的 60 美元低了 90%以上，比 OpenAI o3-mini 性价比模型的价格的 4.40 美元也便宜了一半。所以，我们看到 DeepSeek 通过其自身的技术路径可以实现更低的使用成本，低于 OpenAI、谷歌、Meta 等海外竞争模型。新的技术路径在实现单位算力使用量价格下降的同时，也带动真正的需求端，尤其是企业需求端的成本下降，从而大幅促进 AI 大模型需求的扩张。因此，在较短的时间，较多厂商就将 DeepSeek 引入到自己的平台中，包括云服务平台、搜索、手机、汽车等行业（图表 2）。甚至于，腾讯等通用 AI 大模型厂商也将 DeepSeek 作为选项之一接入到自身平台中（图表 3）。性能飞速提升以及成本大幅下降，这符合新兴技术行业发展初期的特性。从下半年展望来看，AI 大模型行业仍然会见到通用 AI 大模型或底层 AI 大模型不断涌现，在性能和成本两个维度在持续推动行业进步。例如，今年 3 月发布的 Grok-3.0 则在部分指标的表现上优于面世不久的 DeepSeek V3。近期，小米推出的自研推理大模型 MiMo-VL 在多个能力维度也有较好体现。从更长期的维度看，AI 大模型行业将带动科技产业发展。AI 大模型的算力、模型、下游应用都将迎来更加蓬勃的发展。

浦银国际科技传媒