使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Cloud TPU 价格

v2v3 TPU 的价格和配额分为两个系统:

  • 单设备 TPU 类型价格,适用于按需提供或作为抢占式设备提供的单个 TPU 设备。 您无法组合多个单设备 TPU 类型以协同处理单个工作负载。
  • TPU Pod 类型价格,适用于通过专用高速网络相互连接的 TPU 设备集群。只有在您具有评估配额或者购买 1 年期或 3 年期承诺时,才能使用这些 TPU 类型。

使用 Cloud TPU v4 时,所有配置均由 Pod 切片组成,因此只有一个 v4 价格系统

如需了解架构详情以及 v2、v3 和 v4 之间的区别,请参阅 TPU 系统架构文档。

当您的 TPU 节点处于 READY 状态时,就会累积 Cloud TPU 费用。 您会在每个结算周期结束时收到帐单,其中会列出该周期内的用量和费用。

Cloud TPU v4 价格

Cloud TPU v4 是最新一代 Google 用于机器学习的自定义芯片,现已在预览版中提供。它保持了与 Cloud TPU v2 和 v3 的向后兼容性,但每个芯片的原始计算性能比 Cloud TPU v3 提高了 2 倍以上。每个 TPU v4 芯片还包含一个逻辑内核,因此一个程序可以充分利用 32 GiB 的内存,而 v2 和 v2 的利用率分别为 8 和 16 GiB。Cloud TPU v4 Pod 切片与使用 3D 网格拓扑(从 v2 和 v3 的 2D 网格升级)的自定义互连连接,并提供从四个芯片(一个 TPU 虚拟机)到数千个芯片的配置。

TPU v4 Pod 可在 Google 的 us-central2-b 数据中心内使用,即在同一电网中每小时以 90% 的无碳能源运营。

使用 Cloud TPU v4 注册表单详细了解 Cloud TPU v4 Pod 并获取正式发布前访问权限。

下表显示了 Cloud TPU v4 配置的价格。v4 价格基于拓扑结构中的芯片数量。每个芯片中有 2 个核心。

TPU v4 价格 每芯片小时的价格 按需折扣百分比
按需 / 评估 3.22 美元
1 年期(含承诺使用折扣) 2.03 美元 37%
3 年期(含承诺使用折扣) 1.45 美元 55%
抢占式 0.97 美元 70%

Cloud TPU v3 和 Cloud TPU v4 功能和价格比较

Cloud TPU v3 Pod Cloud TPU v4 Pod
主要规范
每个芯片的峰值计算次数 123 万亿次浮点运算 (bf16) 275 万亿次浮点运算(bf16 或 int8)
HBM2 容量和带宽 32 GiB、900 GB/秒 32 GiB、1200 GB/秒
测量的最小/平均值/最大功率 123/220/262 瓦 90/170/192 瓦
TPU Pod 大小 1024 条状标签 4096 条状标签
互连拓扑 2D 环状图 3D 环状图
每个 Pod 的峰值计算次数 126 千万亿次浮点运算 (bf16) 1.1 浮点数(bf16 或 int8)
每个 Pod 的所有减少带宽 340 TB/秒 1.1 PB/秒
每个 Pod 的对分带宽 6.4 TB/秒 24 TB/秒
每芯片小时的价格
评估 $2.00 3.22 美元
1 年期承诺使用折扣 (37%) $1.26 2.03 美元
3 年期承诺使用折扣 (55%) $0.90 1.45 美元
抢占式 $0.60 0.97 美元

价格比较说明

  • 系统显示的是 us-central2-b 位置的 Cloud TPU v4 Pod 价格。
  • 系统会显示 us-east1-d 位置的 Cloud TPU v3 Pod 价格。
  • 每个 TPU v3 芯片有两个核心。系统显示了各个芯片的价格以进行比较。
  • CUD 代表“承诺使用折扣”。

如何购买 v4 配额

请与您的销售团队联系或填写此订单表单

单设备价格

单设备 TPU 类型以 1 秒钟为增量进行计费,并且提供按需价格或抢占式价格。

单设备 TPU 类型是独立的 TPU 设备,无法直接与 Google 数据中心内的其他 TPU 设备建立网络连接。如果您的工作负载需要更多 TPU 核心和更大的内存池,请使用 TPU Pod 类型

抢占式 TPU 是 Cloud TPU 在需要将资源分配给另一项任务时,可以随时终止(抢占)的 TPU。抢占式 TPU 的费用要比普通 TPU 低廉得多。如果抢占式 TPU 在您创建后第一分钟就被抢占,您不需要支付费用。

您可以使用下列单设备 TPU 类型来配置 TPU 节点:

如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

TPU Pod 类型价格

TPU Pod 类型提供对多个 TPU 设备的使用权限,这些 TPU 设备全部通过专用高速网络连接。这些 TPU 类型提供比单个 TPU 节点更大的计算容量和更大的 TPU 内存池。如需使用 TPU Pod 类型,您必须通过以下选项之一申请配额:

  • 申请评估配额,以便测试 TPU Pod 类型的性能。使用评估配额创建的 TPU 节点以 1 秒钟为增量进行计费,但不保证能达到与按需 TPU 设备或者使用承诺配额创建的设备相同的服务等级。评估配额仅在限定期限内对您的项目有效。
  • 购买 1 年期或 3 年期承诺,并创建 TPU 节点(最多不超过 2048 个核心)。承诺不采用增量计费形式。购买承诺后,即可在合约有效期内(按月份计)每天任何时候使用预留核心。在承诺期限内,无论您是否使用了任何 TPU 资源,您都需要按月为购买的承诺付费。

您可使用以下 TPU 类型来配置 TPU 节点:

如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

如需了解不同 TPU 版本和配置之间的差异,请参阅 TPU 系统架构文档

后续步骤

申请自定义报价

借助 Google Cloud 的随用随付价格模式,您只需为实际使用的服务付费。请与我们的销售团队联系,了解贵组织的专属报价。
与销售人员联系