> 数据图表咨询下各位2.1 GPGPU与ASIC是算力两大支柱2025-12-22.1 GPGPU与ASIC是算力两大支柱n 相较于NPU、TPU等AI芯片,GPGPU通用性更强、生态壁垒和开发难度更低:GPGPU采用SIMT架构可实现 “开箱即用”,NPU/TPU仍沿用传统SIMD架构,需手动编排流水线,时延隐藏效率远不及SIMT,导致编写高性能内核难度大、效率低,既难以实现易用性,生态完善程度也落后于GPGPU。n 英伟达GPU是GPGPU主要代表,其架构经历了由Ampere(7nm)至Hopper(4nm)再到Blackwell(4nm)迭代,新一代Rubin(3nm)架构将于26年下半年推出,随AI持续迭代的过程也伴随形态、价值量快速提升。图表:英伟达GPU历代参数迭代梳理架构 类型 发布时间 形态制程(nm)FP4算力(稠密/稀疏*,TFLOPS)FP6INT8FP8FP16/BF16 TF32Volta V100AmperA100e2017年 SXM122020年 SXMHopperH100 2022年 SXMH200 2023年 SXM744/624/1248*3958*//125/312/624*156/312*3958*1979*3958*3958*1979*989*989*显存HBM配置容量(GB)16/32 HBM2 900带宽(GB/s)8080HBM2e2039HBM3 3350141HBM3e4800互联带宽(GB/s)NVLink2.0 300NVLink3.0 600NVLink4.0 900NVLink4.0 900NVLink5.0 18000NVLink5.0 18000TDP(最大功耗,W)3004007007007001000最高达270014001400ASSP(美元)1w单服务器GPU数量/1.5w 82.4w 82.4w 88836/7236/7236/723w//// 26Blackwell+ Blackwell UltraB100B2002024年GB200B300GB3002025年SXM(双die) 4NP 7P/14P*SXM(双die) 4NP 9P/18P*2xB200(4 die) 4NP 20P/40P*SXM(双die) 4NP 15P/17.5P* /2xB300 4NP 30P/38.9P* /3.5P/7P* 3.5P/7P* 3.5P/7P* 1800/3500* 900/1800* 192HBM3e80004.5P/9P* 4.5P/9P* 4.5P/9P* 2250/4500* 1120/2250* 19210P/20P* 10P/20P* 10P/20P* 5P/10P*2500/5000* 384//4.5P/9P* 2.25/4.5P*1120/2250* 28810P/20P* 5P/10P*2500/5000* 576HBM3e8000HBM3e16000 NVLink5.0 18000*2NVLink5.0 18000HBM3e8000HBM3e16000 NVLink5.018000*2来源:英伟达官网,腾讯网,蜂耘网公众号,芯智讯,CSDN,Morgan Stanley,中泰证券研究所中泰证券工业制造