> 数据图表

你知道2.2 大模型推理成本快速下降,推动侧端AI加速落地

2025-8-2
你知道2.2 大模型推理成本快速下降,推动侧端AI加速落地
2.2 大模型推理成本快速下降,推动侧端AI加速落地 大模型价格快速下降,正推动相关应用加速落地。随着大模型算法持续优化,量化技术与蒸馏方法不断迭代,模型在推理阶段所需的算力和能耗显著降低,这使得原本依赖大型服务器集群运行的模型,如今能够迁移至边缘设备以及中小型云平台。与此同时,大量开源项目的涌现,让开发者无需支付高额授权费用,即可获取性能可与商用模型媲美的技术方案。这一变化直接促使单位推理成本从数美元级别降至几美分甚至更低水平,大幅降低了人工智能应用开发与迭代的门槛,进而推动AI应用加速落地。 图 11:ChatGPT价格不断下降 表 2:大模型成本价格不断压缩706050403020100输入价格(美元/百万Tokens)输出价格(美元/百万Tokens)60303010155102.5822024年3月14日2024年4月9日2024年5月13日2024年8月6日2025年6月11日GPT-4GPT-4TurboGPT-4oGPT-4oGPT-4.1大模型名称Deepseek-V3-0324Deepseek-R1-0528GLM-4-Plusdoubao-1.5-thinking-pro通义千问Qwen-turbo通义千问Qwen-PlusERNIE-4.5ERNIE-X1讯飞星火 spark Lite混元-standard混元-proGPT-o3输入价格 元/千输出价格 元/千tokens0.00050.0010.0050.0040.00030.00080.0040.002免费0.00450.03tokens0.0080.0160.0050.0160.00060.0020.0160.008免费0.0050.10.002USD0.008USD宣布价格或宣布下调价格的日期2025/2/272025/2/272025/4/242025/4/282025/4/282025/4/282025/3/162025/3/162024/5/222024/5/222024/5/222024/6/11所属公司深度求索深度求索智谱AI字节跳动阿里云阿里云百度百度科大讯飞腾讯云腾讯云OpenAI资料来源:各公司官网、金元证券研究所