> 数据图表咨询下各位1.2 微架构的先进性:以 Hopper架构为例—CUDA vs Tensor Core
2023-2-01.2 微架构的先进性:以 Hopper架构为例—CUDA vs Tensor CoreHopper SM核心微架构 全能计算型浮点运算单元CUDA Core: 架构上划分为不同精度的计算核心支持多种数据类型,包括INT32、FP32、FP64,每次运算执行一次乘法 1 x 1 per GPU clock。 张量运算专用执行单元Tensor Core: 专门为深度学习、神经网络训练和推理运算设计的运算内核,支持 FP8、FP16、BF16、TF32、FP64 和 INT8 MMA 数据类型,每次运算执行一次矩阵乘法 [1 1 1[1 1 11 1 1 x 1 1 1 per GPU clock1 1 1]1 1 1]33资料来源: NVIDIA H100 Tensor Core GPU Architecture ,中信证券研究部