> 数据图表如何才能Llama3 70B 标准化推理吞吐量
2025-11-3数据中心建设面临能耗问题,低功耗内存架构至关重要。随着 AI 技术迅速兴起,数据中心面临如何在提供海量算力的同时降低能耗的问题。据美光官网援引美国能源部发布的数据中心电力需求增长的评估报告,到 2028 年预计美国数据中心和 AI 的用电量将增加两倍,从而推动美国能源需求极速增长。为应对全球数据中心基础设施日益增长的能源需求,先进的节能型硬件技术至关重要。通过开发和采用创新型低功耗内存架构,数据中心可以获得显著的性能提升,同时比传统 DDR5 内存消耗更少的能源。低功耗内存架构是数据中心必备战略要务,英伟达 Grace CPU 已采用 LPDDR5X。与 DDR5 等传统内存技术相比,低功耗内存的工作电压更低,并通过降低功耗、减少产生的热量、优化的节能型电路设计来提高能源效率。据美光对 LPDDR5X 内存和传统 DDR5 内存进行的对比测试,LPDDR5X 内存可实现至关重要的性能提升。在使用 Meta Llama3 70B 测试推理性能时,LPDDR5X 相比于 DDR5 的推理吞吐量提高 4 倍、延迟降低近 80%、能耗降低 73%。低功耗内存技术可同时降低用电量和运营成本,从而为数据中心带来经济效益,已不仅仅是一种技术升级选项,而是现代数据中心必备的战略要务。英伟达新一代 Grace CPU 使用带有纠错码 ECC 的 LPDDR5X 显存来实现服务器级可靠性,同时将能效提高 5 倍,非常适合云、企业和高性能计算 HPC 工作负载。