Cloud TPU 配额
本文档列出了适用于 Cloud TPU 的配额。如需了解 Cloud TPU 的价格,请参阅 Cloud TPU 价格。
Google Cloud 使用配额来帮助确保公平性并减少资源使用和可用性的激增。配额用于限制您的 Google Cloud 项目可使用的Google Cloud 资源的数量。配额适用于一系列资源类型,包括硬件、软件和网络组件。例如,配额可以限制对某项服务的 API 调用次数、您的项目并发使用的负载均衡器数量或者您可以创建的项目数量。配额可以防止服务过载,从而保护Google Cloud 用户社区。配额还可帮助您管理自己的 Google Cloud 资源。
Cloud 配额系统执行以下操作:
在大多数情况下,当您尝试消耗的资源超出其配额允许的范围时,系统会阻止对资源的访问,并且您尝试执行的任务会失败。
配额通常在 Google Cloud 项目级层应用。您在一个项目中使用资源不会影响您在另一个项目中的可用配额。在 Google Cloud 项目中,配额在所有应用和 IP 地址间共享。
TPU 配额
TPU 配额是指您可以为项目使用的 Cloud TPU 核心数量的限制。Google Cloud 每个版本的 TPU 都与自己的配额相关联。此外,每个 Cloud TPU 版本配额都分为按需配额和抢占式(或即时)配额。
创建 Cloud TPU 资源时,默认情况下,您创建的是按需资源。使用 gcloud
命令创建资源时,您可以使用 --spot
参数创建可抢占型资源。如需了解详情,请参阅管理 TPU 资源。
默认的 Cloud TPU 配额
下表显示了每个可用区域的按需配额和可预取配配额的默认值。这些值指定您可以在项目中使用的 TPU 核心数量上限。
抢占式配额
TPU 版本 | 默认配额(核心数量) | 配额名称 |
---|---|---|
v6e | 64 核 | 每个可用区中每个项目的抢占式 TPU v6e 核心数 |
v5p | 768 个核心 | 每个可用区中每个项目的抢占式 TPU v5p 核心数 |
v5e | 64 核 | 每个可用区中每个项目的抢占式 TPU v5 LitePod 核心数 |
v4 | 0 个核心 | 每个可用区中每个项目的抢占式 TPU v4 pod 核心数 |
v3 Pod | 32 个核心 | 每个可用区中每个项目的抢占式 TPU v3 pod 核心数 |
v3 | 120 个核心 | 每个可用区中每个项目的抢占式 TPU v3 核心数 |
v2 Pod | 32 个核心 | 每个可用区中每个项目的抢占式 TPU v2 pod 核心数 |
v2 | 120 个核心 | 每个可用区中每个项目的抢占式 TPU v2 核心数 |
按需配额
TPU 版本 | 默认配额(核心数量) | 配额名称 |
---|---|---|
v6e | 32 个核心 | 每个地区中每个项目的 TPU v6e 核心数 |
v5p | 128 个核心 | 每个可用区中每个项目的 TPU v5p 核心数 |
v5e | 32 个核心 | 每个项目在每个可用区中的 TPU v5 LitePod 核心数 |
v4 | 0 个核心 | 每个可用区中每个项目的 TPU v4 Pod 核心数 |
v3 pod | 32 个核心 | 每个可用区中每个项目的 TPU v3 Pod 核心数 |
v3 | 40 核 | 每个区域中每个项目的 TPU v3 核心数 |
v2 Pod | 32 个核心 | 每个项目在每个区域的 TPU v2 核心数 |
v2 | 40 核 | 每个可用区中每个项目的 TPU v2 pod 核心数 |
查看和申请更多配额
您可以在 Google Cloud 控制台的“配额”页面上查看为您的项目分配的配额。 Google Cloud
您可以通过“配额”页面申请更多 Cloud TPU 配额。找到您要增加的配额,点击三个垂直点,然后选择修改配额。如需了解详情,请参阅申请更高的配额限制。 如果您请求的配额低于自动批准阈值,系统会自动批准您的请求。
抢占式配额
TPU 版本 | 自动批准阈值 | 配额名称 |
---|---|---|
v6e | 所有可用区:0 个核心 | 每个可用区中每个项目的抢占式 TPU v6e 核心数 |
v5p | 所有可用区:0 个核心 | 每个可用区中每个项目的抢占式 TPU v5p 核心数 |
v5e |
|
每个可用区中每个项目的抢占式 TPU v5 LitePod 核心数 |
v4 | 所有可用区:0 个核心 | 每个可用区中每个项目的抢占式 TPU v4 pod 核心数 |
v3 Pod |
|
每个可用区中每个项目的抢占式 TPU v3 pod 核心数 |
v3 |
|
每个可用区中每个项目的抢占式 TPU v3 核心数 |
v2 Pod |
|
每个可用区中每个项目的抢占式 TPU v2 pod 核心数 |
v2 |
|
每个可用区中每个项目的抢占式 TPU v2 核心数 |
按需配额
TPU 版本 | 自动批准阈值 | 配额名称 |
---|---|---|
v6e | 所有可用区:0 个核心 | 每个地区中每个项目的 TPU v6e 核心数 |
v5p | us-east5-a:64 核 | 每个可用区中每个项目的 TPU v5p 核心数 |
v5e | 所有可用区:64 核 | 每个项目在每个可用区中的 TPU v5 LitePod 核心数 |
v4 | 所有可用区:0 个核心 | 每个可用区中每个项目的 TPU v4 Pod 核心数 |
v3 pod |
|
每个可用区中每个项目的 TPU v3 Pod 核心数 |
v3 |
|
每个区域中每个项目的 TPU v3 核心数 |
v2 Pod |
|
每个项目在每个区域的 TPU v2 核心数 |
v2 |
|
每个可用区中每个项目的 TPU v2 pod 核心数 |
您会收到一封电子邮件,告知您配额申请是否获得批准。Google Cloud 服务配额的增加是逐步进行的。这可能会导致在不同区域或资源中持续进行发布。在发布期间,Google Cloud 控制台或 Cloud Quotas API 中显示的配额值不会体现增加后的新配额值,直到发布完成为止。如需了解详情,请参阅查看正在进行的发布。