> 数据图表

如何了解1.2、NPU是专用加速芯片,适用于乘法累加运算

2025-4-1
如何了解1.2、NPU是专用加速芯片,适用于乘法累加运算
1.2、NPU是专用加速芯片,适用于乘法累加运算◼ MAC(Multiply-Accumulate)是NPU中的基本单元,主要反应NPU的算力水平,占芯片主要面积。MAC是相乘和相加的两个过程(即a ← a + ( b × c ) ),在硬件电路单元中称为“乘数累加器”,因此可以通过一个MAC指令完成乘加两个指令操作,适用于卷积运算、点积运算、矩阵运算等,广泛使用于神经网络加速以及其他需要高效数学计算的领域,本质上MAC的运算能力即反应NPU的算力水平。◼ 一个典型的MAC阵列由多个MAC单元组成,每个MAC单元会独立进行乘法累加运算,通过并行及流水线技术提升整体性能。假设一个4*4的MAC阵列,则表示4行4列共计16个MAC单元,如昇腾310包含64*64阵列即4096 MACs矩阵,特斯拉FSD为96*96阵列即9216 MACs。NPU使用MAC阵列做神经网络加速时,如卷积运算、矩阵运算、点积运算等均可分解成数个MAC指令从而提升效率。图表:特斯拉Dojo Core架构图表:矩阵相乘示意图来源:《基于多块卷积变分信息瓶颈的多变量动态过程故障诊断》,中泰证券研究所12