Cloud TPU 配额

本文档列出了适用于 Cloud TPU 的配额。如需了解 Cloud TPU 的价格,请参阅 Cloud TPU 价格

Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。

Cloud 配额系统执行以下操作:

在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。

配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。

TPU 配额

TPU 配额是指您可以为项目使用的 Cloud TPU 核心数量的限制。Google Cloud 每个版本的 TPU 都与自己的配额相关联。此外,每个 Cloud TPU 版本配额都分为按需配额和抢占式(或即时)配额。

创建 Cloud TPU 资源时,默认情况下,您创建的是按需资源。使用 gcloud 命令创建资源时,您可以使用 --spot 参数创建可抢占型资源。如需了解详情,请参阅管理 TPU 资源

默认的 Cloud TPU 配额

下表显示了每个可用区域的按需配额和可预取配配额的默认值。这些值指定您可以在项目中使用的 TPU 核心数量上限。

抢占式配额

TPU 版本 默认配额(核心数量) 配额名称
v6e 64 核 每个可用区中每个项目的抢占式 TPU v6e 核心数
v5p 768 个核心 每个可用区中每个项目的抢占式 TPU v5p 核心数
v5e 64 核 每个可用区中每个项目的抢占式 TPU v5 LitePod 核心数
v4 0 个核心 每个可用区中每个项目的抢占式 TPU v4 pod 核心数
v3 Pod 32 个核心 每个可用区中每个项目的抢占式 TPU v3 pod 核心数
v3 120 个核心 每个可用区中每个项目的抢占式 TPU v3 核心数
v2 Pod 32 个核心 每个可用区中每个项目的抢占式 TPU v2 pod 核心数
v2 120 个核心 每个可用区中每个项目的抢占式 TPU v2 核心数

按需配额

TPU 版本 默认配额(核心数量) 配额名称
v6e 32 个核心 每个地区中每个项目的 TPU v6e 核心数
v5p 128 个核心 每个可用区中每个项目的 TPU v5p 核心数
v5e 32 个核心 每个项目在每个可用区中的 TPU v5 LitePod 核心数
v4 0 个核心 每个可用区中每个项目的 TPU v4 Pod 核心数
v3 pod 32 个核心 每个可用区中每个项目的 TPU v3 Pod 核心数
v3 40 核 每个区域中每个项目的 TPU v3 核心数
v2 Pod 32 个核心 每个项目在每个区域的 TPU v2 核心数
v2 40 核 每个可用区中每个项目的 TPU v2 pod 核心数

查看和申请更多配额

您可以在 Google Cloud 控制台的“配额”页面上查看为您的项目分配的配额。 Google Cloud

您可以通过“配额”页面申请更多 Cloud TPU 配额。找到您要增加的配额,点击三个垂直点,然后选择修改配额。如需了解详情,请参阅申请更高的配额限制。 如果您请求的配额低于自动批准阈值,系统会自动批准您的请求。

抢占式配额

TPU 版本 自动批准阈值 配额名称
v6e 所有可用区:0 个核心 每个可用区中每个项目的抢占式 TPU v6e 核心数
v5p 所有可用区:0 个核心 每个可用区中每个项目的抢占式 TPU v5p 核心数
v5e
  • us-east5-b:800 个核心
  • us-west4-a:1600 核
  • us-west4-b:3968 个核心
  • us-west1-c:576 个核心
  • us-central1-a:3264 个核心
  • europe-west4-a:4032 个核心
每个可用区中每个项目的抢占式 TPU v5 LitePod 核心数
v4 所有可用区:0 个核心 每个可用区中每个项目的抢占式 TPU v4 pod 核心数
v3 Pod
  • europe-west4-a:512 个核心
  • us-east1-d:320 个核心
每个可用区中每个项目的抢占式 TPU v3 pod 核心数
v3
  • us-central1-a:64 核
  • europe-west4-a:128 个核心
每个可用区中每个项目的抢占式 TPU v3 核心数
v2 Pod
  • us-central1-a:64 个核心
  • europe-west4-a:64 核
每个可用区中每个项目的抢占式 TPU v2 pod 核心数
v2
  • us-central1-b:128 个核心
  • us-central1-c:64 个核心
  • us-central1-f:128 个核心
  • europe-west4-a:32 核
每个可用区中每个项目的抢占式 TPU v2 核心数

按需配额

TPU 版本 自动批准阈值 配额名称
v6e 所有可用区:0 个核心 每个地区中每个项目的 TPU v6e 核心数
v5p us-east5-a:64 核 每个可用区中每个项目的 TPU v5p 核心数
v5e 所有可用区:64 核 每个项目在每个可用区中的 TPU v5 LitePod 核心数
v4 所有可用区:0 个核心 每个可用区中每个项目的 TPU v4 Pod 核心数
v3 pod
  • europe-west4-a:128 个核心
  • us-east1-d:64 个核心
每个可用区中每个项目的 TPU v3 Pod 核心数
v3
  • us-central1-a:64 个核心
  • europe-west4-a:128 个核心
每个区域中每个项目的 TPU v3 核心数
v2 Pod
  • us-central1-a:64 个核心
  • europe-west4-a:64 核
每个项目在每个区域的 TPU v2 核心数
v2
  • us-central1-b:128 个核心
  • us-central1-c:64 个核心
  • us-central1-f:128 个核心
  • europe-west4-a:32 核
每个可用区中每个项目的 TPU v2 pod 核心数

您会收到一封电子邮件,告知您配额申请是否获得批准。Google Cloud 服务配额的增加是逐步进行的。这可能会导致在不同区域或资源中持续进行发布。在发布期间,Google Cloud 控制台或 Cloud Quotas API 中显示的配额值不会体现增加后的新配额值,直到发布完成为止。如需了解详情,请参阅查看正在进行的发布