Ironwood 张量处理单元 (TPU)

Ironwood：专为推理而打造的第 7 代 Google Cloud TPU

使用迄今最强大的 TPU 高效地训练和提供更大的模型和数据集。

询问更多信息

姓氏

名字

公司电子邮箱

呼叫代码

工作电话

职位

公司名称

我愿意接收 Google 关于 Google Cloud 的新闻、产品更新、活动信息以及特别优惠。

我理解，我的个人数据将根据 Google 隐私权政策进行处理。

您的基础设施是否已为推理时代做好准备？

Ironwood 是 Google 的第七代张量处理单元 (TPU)，也是专为大规模 AI 推理而设计的首个 TPU 加速器，在 2025 年 Google Cloud Next 大会上发布。Ironwood 是基于 Google 为内部服务和 Google Cloud 客户开发 TPU 的丰富经验而设计的，旨在满足模型（例如大语言模型 [LLM]、专家混合 [MoE] 模型和高级推理任务）的计算和内存需求。支持在 Google Cloud AI Hypercomputer 架构内训练和提供工作负载。

针对大语言模型 (LLM) 进行优化：Ironwood 专为满足 LLM 和生成式 AI 应用日益增长的需求而设计。
增强型互连技术：受益于 TPU 互连技术的改进，实现更快的通信和更短的延迟。
高性能计算：在执行各种推理任务时，性能显著提升。
可持续的 AI：Ironwood 延续了 Google Cloud 对可持续性的承诺，在提高能源效率的同时提供卓越的性能。

Ironwood 集成了更高的计算密度、内存容量和互连带宽，并显著提高了功率效率。这些功能旨在为要求苛刻的 AI 训练和服务工作负载提供更高的吞吐量和更低的延迟，尤其是涉及大型复杂模型的工作负载。Ironwood TPU 在 Google Cloud AI Hypercomputer 架构内运行。

请登记您的意向以抢先体验。

此产品目前为抢先体验版。如需详细了解我们的产品发布阶段，请点击此处

Cloud AI 产品遵循我们的服务等级协议 (SLA) 政策。这些产品在延迟时间或可用性方面的保证可能与其他 Google Cloud 服务有所不同。