> 数据图表你知道2.3 张量并行可优化计算效率2025-8-22.3 张量并行可优化计算效率• 目前模型训推主要采用混合并行,即多种并行方式同时进行,可从不同维度切分/编组进行并行• 张量并行、专家并行是粒度更细的并行方式,更高效利用单张芯片配套内存,因此可以明显提升计算效率。(由于篇幅有限本文未就技术原理做详细阐述,具体细节欢迎进一步交流)3D混合并行计算在两类推理引擎中张量并行(TP)均可缩短输出单Token所需时间(TPOT)资料来源:《3D parallelism: Scaling to trillion-parameter models》, SqueezeBits,东吴证券研究所13东吴证券综合其他