> 数据图表如何看待2.2.2 华为云CloudMatrix 384通过多卡互联实现性能弯道超车2025-9-32.2.2 华为云CloudMatrix 384通过多卡互联实现性能弯道超车图表17:华为CloudMatrix 384与英伟达GB200 NVL72性能对比图 25年4月,华为发布384超节点,凭借其颠覆性的系统架构设计与全栈技术创新,在多项关键指标上实现对英伟达旗舰产品GB200 NVL72的超越,标志着中国在人工智能基础设施领域实现里程碑式突破。 CloudMatrix 384由384颗昇腾910C芯片组成,这些芯片通过全互联拓扑结构连接。其中的权衡很简单:昇腾芯片的数量是英伟达 Blackwell芯片的五倍,这足以弥补每颗昇腾芯片的性能仅为后者三分之一的差距。 完整的CloudMatrix系统现在可以提供300 PFLOPs的密集型BF16计算能力,几乎是GB200 NVL72的两倍;凭借超过3.6倍的总内存容量和2.1倍的内存带宽,为大规模AI训练和推理提供了更高效的硬件支持。图表16:华为CloudMatrix 384实物图资料来源:华为,Semianalysis,中邮证券研究所请参阅附注免责声明14资料来源:华为,英伟达,Semianalysis,中邮证券研究所中邮证券综合其他