> 数据图表

你知道4.1 NPU发展历程:算力攀升,场景突破

2025-4-1
你知道4.1 NPU发展历程:算力攀升,场景突破
4.1 NPU发展历程:算力攀升,场景突破高通是NPU研发起步最早的公司之一,其发展历程具备一定代表性:NPU从初代探索、至发展优化,都在顺应AI的发展需要,经历了架构迭代、算力攀升,而实现在多种终端场景的应用。◼ 架构:早期由DSP架构奠基,逐步集成标量、向量、张量加速单元,并引入Transformer支持。◼ 性能:持续优化,至最新一代PC芯片AI算力达75TOPS,智驾芯片AI算力达720TOPS。◼ 应用:从基础语音/图像处理到支持超百亿参数大模型,覆盖手机、PC、智驾等多终端场景。早期基础阶段图表:高通NPU发展历程张量加速,端侧应用拓展关键技术增强,跑通百亿参数 智驾、PC端突破DSP架构奠定基础:首款Hexagon DSP亮相骁龙平台,其DSP控制和标量架构是高通未来多代NPU的基础。首次集成AI引擎:推出骁龙 820 ,支持成像、音频和传感器运算,集成了标量和向量运算。增加张量加速器:骁龙 855 增加了张量加速器(HTA),支持多元数学运算、非线性方程、INT16/INT8与混合精度整数运算,以应对图片和视频处理的需求。架构变革:融合了向量、张量、标量加速器,叠加专用大共享内存,实现更好的性能功耗表现,Hexagon 780加速器的 AI算力达到26TOPS。关键技术加强:骁龙 8 Gen2 中NPU 使用专用电源传输轨道、微切片推理、int4 以提升能效和内存带宽效率、Transformer 网络加速以及优化的分组卷积等特殊硬件。AI性能持续提升:推出骁龙 X Elite 平台,NPU算力45TOPs,AI引擎达75TOPS,支持设备端运行超过130亿的大模型,支持多模态生成式AI和更长的token输入。200720132015201820192020初代NPU:首款量产采用创新架构设计的处理器 Zeroth,更接近于用电路对生物神经细胞进行模拟AI算力增加、拓展端侧用例:骁龙 865拓展AI成像、AI视频、AI语音和始终在线的感知功能,AI性能从7TFLOPS提升到了15TFLOPS。来源:高通官网,中泰证券研究所202220232024性能提升至支持百亿参数模型:骁龙 8 Gen3 中进一步升级了 NPU 微架构及相关能力,性能提升98% ,能效提升40%;支持 LLM 和 LVM,增加更多的硬件加速单元,增加大共享内存,支持4.8GHz 频率的 LPDDR5X,可运行 百亿参数模型。36