> 数据图表如何解释1.2、NPU是专用加速芯片,适用于乘法累加运算
2025-4-11.2、NPU是专用加速芯片,适用于乘法累加运算➢ FLOPS(Floating Point Operations Per Second)即每秒浮点运算次数,代表浮点运算速度。浮点计数是利用浮动小数点的方式,使用不同长度的二进制来表示一个数字,一般采用4个字节即32位二进制来表达一个数字,因此FP32/FP64/FP16分别代表单精度、双精度、半精度。FP64常用于对精度要求高的科学计算或超算,AI深度学习主要用FP32或FP16。➢ 算力(Tops)是衡量NPU性能的常见指标,理论峰值=MAC矩阵行*MAC矩阵列*主频*2。MAC直接反映NPU算力水平:假设NPU内置一个N*Y的MAC矩阵,则算力理论峰值=MAC矩阵行*MAC矩阵列*主频*2,其中2为两次运算,即一次乘法加一次加法,主频决定NPU及其MAC单元运算的时钟速度。以特斯拉FSD为例,每个NPU拥有96x96 MAC,主频为2GHz,则单个NPU的TOPs为96 * 96 * 2 * 2G = 36.86TOPS。图表:不同数据格式的构成与应用图表:不同格式浮点表示数据格式构成用途FP64FP321位符号、11位指数、52位尾数常用于对精度要求高的科学计算1位符号、8位指数、23位尾数深度学习模型训练的常见格式TF321位符号、8位指数、10位尾数替代FP32数据格式实现深度学习和HPC计算加速FP161位符号、5位指数、10位尾数深度学习越来越偏向使用FP16BF16INT81位符号、5位指数、7位尾数提升AI模型的推理速度和布置零后续8个bit表示一个字INT8精度相对较低,常用于AI模型的端侧推理来源:CSDN,中泰证券研究所13