> 数据图表我想了解一下3.1 存算一体是NPU打破计算瓶颈的主要方式
2025-4-13.1 存算一体是NPU打破计算瓶颈的主要方式◼ 除算力指标外,内存墙、功耗墙也影响NPU实际利用率。内存墙是指在实际应用中,NPU堆MAC单元能够拉高算力指标,但会受内存带宽限制,导致数据的传输速率不足,MAC单元不断等待,实际处理性能下降的现象;功耗墙是指计算单元存算分离设计导致数据重复搬移,共享困难,数据在多级存储间传输,能耗大。随着AI发展,端侧数据量逐步提升,数据的传输速度不足以及能耗高也逐步成为限制NPU性能的瓶颈。◼ 存算一体及混合精度是解决NPU在AI计算瓶颈的主要方式。混合精度是通过软件技术,将不同精度的浮点数进行数值计算,从而减少数据搬运,可以一定程度提高NPU效率。而存算一体则是从底层架构上,彻底解决NPU的算力瓶颈,其核心是将计算和存储融合,降低“内存墙”问题,实现计算能效的数量级提升。谷歌基于边缘设备运行神经网络模型,发现1)62.7%的系统能耗是花费在数据移动上;2)数据移动主要来自内存中的简单函数,如乘累加等,因此解决内存墙,核心是要将计算函数搬移到数据存储的地方,而非把数据搬移到处理器中进行计算。来源:中泰证券研究所29