> 数据图表

如何了解1.2 架构的先进性:NVIDIA历代微架构对比

2023-2-0
如何了解1.2 架构的先进性:NVIDIA历代微架构对比
1.2 架构的先进性:NVIDIA历代微架构对比架构代号Fermi费米2010中文代号时间核心参数特点\优势NVIDIA历代微架构对比Kepler开普勒2012Maxwell麦克斯韦2014Pascal帕斯卡2016Volta伏特2017TuringAmpereHopper图灵2018安培2020赫柏202216个SM,每个SM包括32 Cuda Cores,共计15个SMX,每个SMX包括192个单精度+64个双精度的512 Cuda CoresCuda cores16个SMM,每个SM包括4个处理块,每个处理块包括32个CUDA内核+8个LD/STUnit+8个SFUPascal架构有GP100、GP102GP100有60个SM每个SM包括64个cuda cores32个DP cores80个SM,每个SM里32个FP6464个lNT3264个FP328个Tensor coreTU102核心72个SM,SM全新设计,每个SM里64个lNT3264个FP328个Tensor coreA100有108SMsH100有132 SM每个SM64个FP3264个INT3232个FP64每个SM128个FP3264个INT3264个FP644个Tensor core4个Tensor core首个完整GPU计算架构,支持与共享存储结合纯Cache层次的GPU架构,支持ECC的GPU架构游戏性能大幅提升首次支持GPUDirect技术相比Kpler的每组SM单元192个减少到了每组128个,但是每个SMM单元拥有更多的逻组控制电路NVLink一代,双向互联带宽160GB/s P100有56个SMHBMNvlink2.0Tensor Core 1.0满足深度学习和AI运算Tensor Core 2.0RT Core 1.0Tensor Core 3.0RT Core 2.0Nvlink 3.0结构稀疏性MIG1.0Tensor Core 4.0Nvlink 4.0结构稀疏性矩阵MIG 2.0纳米制程40/28nm30亿晶体管28nm71亿晶体管28nm80亿品体管16nm153亿品体管12nm211亿晶体管12nm186亿晶体管7nm5nm283亿晶体管800亿个晶体管代表型号Quadro 7000K80K40MM5000M4000P100GTX1080P6000V100TiTan VT42080TIRTX 5000A100、A303090H100资料来源:NVIDIA官网,中信证券研究部35