> 数据图表

咨询下各位4.7 华为昇腾NPU:自研达芬奇架构

2025-4-1
咨询下各位4.7 华为昇腾NPU:自研达芬奇架构
4.7 华为昇腾NPU:自研达芬奇架构➢ 达芬奇NPU架构主要包含3类单元:1)计算单元;2)存储系统;3)控制单元。计算单元包含矩阵计算单元(DaVinciCore)、向量计算单元(Vector)及标量计算单元(Scalar);存储控制是AI Core 片上存储单元和相应数据通路构成存储系统;控制单元为计算过程提供指令控制,负责AI Core的运行。其中AI core每次可执行完成fp16的矩阵乘,大的矩阵运算需要在L1 Buffer中对矩阵进行分块;Vector灵活度高,所有计算的源数据和目标会存储在Unified Buffer中;Scalar负责各类型标量数据运算和程序流程控制,三者算力依次递减,最终累加器把当前矩阵乘的结果与上一次计算结果相加。图表:华为达芬奇NPU架构图来源:华为昇腾,中泰证券研究所51