> 数据图表如何看待TPU 对外出租时的每小时 TCO2026-3-3多家公司推出 ASIC 芯片,竞争 GPU 市场。Meta 将于 2025Q4 推出其首款ASIC 芯片 MTIA T-V1。它由博通设计,具有复杂的主板架构,并采用液冷和风冷混合技术。到 2026 年年中,MTIA T-V1.5 将进行进一步升级,芯片面积将翻倍,超过英伟达下一代 GPU Rubin 的规格,其计算密度将直接接近英伟达的 GB200 系统。2027 年的 MTIA T-V2 可能会带来更大规模的CoWoS 封装和高功率机架设计。Meta 的目标是到 2025 年底至 2026 年实现100 万至 150 万件 ASIC 出货量。2025 年 5 月,英伟达正式发布 NVLink Fusion。NVLink Fusion 允许数据中心将英伟达 GPU 与第三方 CPU 或定制化 AI 加速器混合使用,标志着英伟达正式打破硬件生态壁垒。此外,微软、亚马逊同样有自研的 ASIC 芯片。 在这场竞争中,谷歌最核心的竞争力在于 TPU,而 TPU 的成功关键在于OCS,谷歌 TPU 区别于其他 ASIC 的最大关键也在于 OCS。OCS(Optical circuit switches),即光电路交换机,是在光层动态地配置互连拓扑,类似于传统的交换机在电层交换的作用。Google 在建设自己的数据中心过程中,由于在部署规模、灵活可用、模块化部署、安全性、功耗和性能等方面有更高要求,传统电交换不满足相关的互联需求,因此引入了 OCS 形成新的解决方案。根据 Google 论文的数据,在搭建 TPUv4 的集群时,与传统 InfiniBand 交换机方案相比,OCS 方案成本更低,功耗更低,部署更快,其中 OCS 和其他光学组件的成本在系统总成本的占比低于 5%,功耗占比低于 3%。目前 OCS 在 Google 基础设施中主要有 Jupiter 数据中心和 TPU 数据中心两大应用场景,其中后者为专注于 AI 算力的数据中心。 OCS 为 TPU 集群提供指数级能力增强,提高谷歌竞争优势。Google 用户能够体验到的最大优势,即用户可以根据自己的模型定制基础设施需 求:GPU 性能或过于冗余,但是 OCS 则通过创建自定义网络拓扑结构,从而改变网络节点结构,从而进行各种资源配置。同时 OCS 交换机为 TPU 提供了巨大的成本和功耗优势,从而帮助谷歌在竞争中取胜。国泰海通综合其他