> 数据图表

我想了解一下英伟达 GB200 超节点系统效率增益情况测算(含假设,仅供参考)

2026-4-6
我想了解一下英伟达 GB200 超节点系统效率增益情况测算(含假设,仅供参考)
市场时常困惑于:1)超节点相对于同样多卡数的普通节点集群有何领先之处2)为什么中美算力龙头厂商都在追求超节点我们以英伟达的超节点为例进行阐释: 英伟达 NVL72(24 年 3 月发布):根据英伟达官网 25 年 6 月的对比,在 MLPerf 性能评价体系下,同样训练 Llama 3.1Llama 2 70B 模型,GB200 中的 B200 单卡性能相比传统节点中的 H100 提升了约 2.2x2.5x同样在 Llama 3.1Llama 2 70B 模型下进行推理,GB200中的 B200 单卡性能相比传统节点中的 H100 提升了约 2.8-3.4x3.1x。我们注意到,以上对比是针对 B200 和 H100 的,并未直接对比 B200 这张卡在超节点和普通节点中的性能差异(由于商务原因,各家算力大厂不太可能直接对比同一代产品的超节点和普通节点性能),因此该提升倍数可能隐含 B200 相对 H100 架构升级带来的性能提升,我们需要剔除该影响:考虑在前述的提升倍数基础上,除以 B200 与 H100 本身在 FP16 理论峰值算力的差异(约2.27x)。最终我们得到结论,GB200 超节点系统对于效率的增益(与普通节点做对比):训练环节基本保全性能并有小幅增益推理环节有较大幅度增益(20%50%)。 因此我们认为,超节点的意义并非提升算力峰值,而是在实际训推任务中将单卡理论优势保全到系统层级(即通过降低通信与同步开销、提高算力利用率,将更多的峰值算力转化为可用吞吐)。