> 数据图表

一起讨论下KIMI 提出 MoonCake Store 技术,借助分布式 KV Cache 存储池降低推理成本

2026-3-2
一起讨论下KIMI 提出 MoonCake Store 技术,借助分布式 KV Cache 存储池降低推理成本
1.2 CXL 方案持续创新,进一步适配 AI 推理需求 三星推出 CMM-H 混合存储 CXL 模组,将 DRAM 内存和 NAND 闪存相结合。三星 CMM-H 作为基于 CXL 协议的创新混合内存方案,将 DRAM 内存和 NAND 闪存相结合,利用 DRAM 提供内存级的访问速度,保障关键数据与 KVCache 的高速存取,同时借助 NAND 显著扩展存储空间,以更低成本承载海量模型参数与历史状态。展望未来,基于 CXL 协议的类似的混合内存设计有望为AI 推理等场景进一步提供兼具大容量、高性能与数据持久性的灵活解决方案。