使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Cloud TPU 价格

Cloud TPU 是专为在 Google Cloud 上运行先进的机器学习模型而打造的定制超级计算机,具有业界领先的性价比。计算能力的百亿亿次计算器可帮助您推动企业转型或创造下一项研究突破。

详细了解 Cloud TPU v4 Pod 如何帮助机器学习研究人员和开发者以可持续且高效的方式突破 AI 的边界。

了解哪种 Cloud TPU 产品最适合您的独特项目需求。

Cloud TPU 价格的运作方式

产品

Cloud TPU v4 Pod 是最新一代的 Google 自定义机器学习加速器,现已在正式版中提供。所有 TPU v4 Pod 切片形状都使用相同的 v4 价格系统

但是,Cloud TPU v2v3 TPU 的价格和配额分为两个系统:

  • 单设备 TPU 价格,适用于按需提供或作为抢占式设备提供的单个 TPU 设备(评估定价折扣为 70%)。单设备 TPU 类型是独立的 TPU 设备,无法与 Google 数据中心内的其他 TPU 设备建立直接网络连接。如果您的工作负载需要更多 TPU 核心和更大的内存池,请改用 TPU Pod 切片
  • TPU Pod 价格,适用于通过专用高速网络相互连接的 TPU 设备集群。如果您拥有评估配额、抢占式配额(评估定价折扣为 70%)或购买 1 年期或 3 年期承诺,则可以使用这些 TPU 类型。

如需详细了解 TPU v2、v3 和 v4,请参阅 TPU 系统架构

当您的 TPU 节点处于 READY 状态时,就会累积 Cloud TPU 费用。 您会在每个结算周期结束时收到帐单,其中会列出该周期内的用量和费用。

使用选项

类型 TPU 产品 结算 适用情形
3 年期承诺(3 年期承诺使用折扣) TPU v4 Pod、TPU v3 Pod、TPU v2 Pod 每月,基于预留的配额 需要持续访问 512 个以上容量核心的机器学习用户
1 年期承诺(1 年期承诺使用折扣) TPU v4 Pod、TPU v3 Pod、TPU v2 Pod 每月,基于预留的配额 需要持续访问 32-512 个核心的机器学习用户
评估(按需) TPU v4 Pod、TPU v3 Pod、TPU v2 Pod、TPU v3*、TPU v2* 每小时,基于实际用量 希望运行一些短期实验或基准的机器学习用户
抢占式 TPU v4 Pod、TPU v3*、TPU v3 Pod、TPU v2*、TPU v2 Pod 每小时,基于实际用量 想要运行批量 / 容错工作负载的机器学习用户

*单核具有 8 个核心。在 SKU 页面上,这些设备称为 Tpu-v2 或 Tpu-v3 加速器。

条状标签、核心与虚拟机

1 个 TPU 虚拟机(TPU 虚拟机)有 4 个芯片和 8 个核心。Google Cloud 控制台中的结算以虚拟机小时为单位(例如,单个 Cloud TPU v4 主机的按需价格,包括四个 TPU v4 芯片,每小时的费用为 $12.88)。Google Cloud 控制台中的使用情况数据也以虚拟机小时为单位进行计量。

通过 TRC 免费访问

新客户可获得 $300 赠金,用于抵扣在 Google Cloud 上的支出。 立即开始使用

如果您是研究人员、学生、修补程序员、艺术家或企业家,请考虑申请加入 TPU Research Cloud 计划。TRC 成员可以免费访问大量 Cloud TPU,并可通过同行评审的出版物、开放源代码、博文、视频和其他媒体与全世界分享自己的作品。(下面是支持 TRC 的出版物的示例。)

立即申请,加快您的研究进度!

价格组成部分

Cloud TPU v4 价格

Cloud TPU v4 是 Google 最新一代的自定义机器学习加速器,现已正式发布。它保留了与 Cloud TPU v2 和 v3 的向后兼容性,但每个芯片的原始计算性能比 Cloud TPU v3 高出 2 倍。每个 TPU v4 芯片还包含一个逻辑核心,因此,一个程序可以充分利用 32 GiB 的内存,而在 v2 上为 8 GiB,在 v3 上为 16 GiB。Cloud TPU v4 Pod 切片与使用自定义互连(使用 3D 网格拓扑、v2 和 v3 中的 2D 网格升级)连接,并提供从四个芯片(一个 TPU 虚拟机)到数千个芯片的配置。

Cloud TPU v4 Pod 可在 us-central2-b 部分使用,这是 Google 的数据中心,可以 90% 的无碳能源每小时使用同一网格。这是全球最大的公开机器学习中心,每秒最多可实现 9 亿次的聚合性能。

下表显示了 Cloud TPU v4 配置的价格。v4 价格取决于拓扑结构中的芯片数量。每个芯片中有 2 个核心。

TPU v4 价格 每芯片小时价格 按需折扣
按需 / 评估 3.22 美元
1 年期承诺使用折扣(承诺使用折扣) 2.03 美元 37%
3 年期承诺使用折扣(承诺使用折扣) 1.45 美元 55%
抢占式 0.97 美元 70%

Cloud TPU v2 和 v3 价格

Cloud TPU v2 和 v3 TPU 的价格和配额分为两个系统:

  • 单设备 TPU 类型价格,适用于按需提供或作为抢占式设备的单个 TPU 设备。您无法组合多个单设备 TPU 类型以协同处理单个工作负载。
  • TPU Pod 类型价格,适用于通过专用高速网络相互连接的 TPU 设备集群。只有在您具有评估配额或购买 1 年期或 3 年期承诺时,才能使用这些 TPU 类型。

如需了解架构详细信息以及 v2、v3 和 v4 之间的区别,请参阅 TPU 系统架构文档。

单设备价格

单设备 TPU 类型以 1 秒钟为增量进行计费,并且提供按需价格或抢占式价格。

单设备 TPU 类型是独立的 TPU 设备,无法直接与 Google 数据中心内的其他 TPU 设备建立网络连接。如果您的工作负载需要更多 TPU 核心和更大的内存池,请使用 TPU Pod 类型

抢占式 TPU 是一种 TPU,如果 Cloud TPU 需要访问其他任务的资源,则可以随时抢占。抢占式 TPU 的费用要比普通 TPU 低廉得多。如果抢占式 TPU 在您创建后第一分钟就被抢占,您不需要支付费用。

TPU Pod 类型价格

TPU Pod 类型提供对接入专用高速网络的多个 TPU 设备的访问权。与单个 TPU 节点相比,这些 TPU 类型具有更大的计算容量和更大的 TPU 内存池。如需使用 TPU Pod 类型,您必须通过以下选项之一申请配额:

  • 申请评估配额,以便测试 TPU Pod 类型的性能。使用评估配额创建的 TPU 节点以 1 秒钟为增量进行计费,但不保证能达到与按需 TPU 设备或者使用承诺配额创建的设备相同的服务等级。评估配额仅在项目中保留有限的一段时间。
  • 购买 1 年期或 3 年期承诺,并创建 TPU 节点(最多不超过 2048 个核心)。通过承诺,您可以在合同期内的任何时候访问预留核心。在承诺期限内,即使您未使用任何 TPU 资源,我们也需要按月收取固定费用。

您可使用以下 TPU 类型来配置 TPU 节点:

如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

如需了解不同 TPU 版本和配置之间的差异,请参阅 TPU 系统架构文档

优化费用

与 Azure 的 A100 相比,Cloud TPU v4 在基于转换器的模型上最多可节省 35% 的费用,在 ResNet 上最多可节省 50%

Cloud TPU v4 费用比较

鉴于 GPT-3PaLM 等真实模型比 MLPerf 基准中使用的 BERT 和 ResNet 模型大得多,因此节省费用尤其重要:PaLM 是 5400 亿个参数模型,而 MLPerf 基准中使用的 BERT 模型只有 3.4 亿个参数,相差 1000 倍根据我们的经验,TPU 的优势将随着规模的增加而显著增加,这使得在 Cloud TPU v4 上进行训练更具吸引力。

估算所需费用

使用 Compute Engine 价格计算器估算 Cloud TPU 使用费,并在顶部栏中选择“Cloud TPU”。

更进一步

申请自定义报价

借助 Google Cloud 的随用随付价格模式,您只需为实际使用的服务付费。请与我们的销售团队联系,获得适合贵组织的自定义报价。
与销售人员联系