配额政策

配额的分配方式

配额的多少取决于 Cloud TPU 核心的数量。每个 Cloud TPU 设备由 4 个 TPU 芯片和 8 个核心组成,每个 TPU 芯片包含 2 个核心。Cloud TPU v2 Pod 由 64 个 TPU 设备组成,共包含 256 个 TPU 芯片(512 个核心)。Cloud TPU v3 Pod 由 256 个 TPU 设备组成,共包含 1024 个 TPU 芯片(2048 个核心)。核心数还表示特定 Cloud TPU 的配额。例如,配额为 8 时可使用 8 个核心。配额为 16 时最多可使用 16 个核心,依此类推。

“版本-核心数”表示法(比如 v2-8)表明了 Cloud TPU 的版本和核心数。由于核心数也起到指明配额的作用,因此该表示法也说明了 Cloud TPU 的配额分配情况。例如,v2-32 表示具有 32 个核心的 TPU v2 类型。

在您创建新的 Google Cloud 项目时,Cloud TPU 会为该项目分配一个默认配额。

单设备 TPU 类型的配额

单设备 TPU 类型对按需核心计数和抢占式 TPU 核心计数均设有配额。

  • 按需 TPU:默认配额为 16 个核心(2 个 TPU 设备)
  • 抢占式 TPU:默认配额至少为 48 个核心(6 个 TPU 设备)

TPU Pod 类型的配额

Cloud TPU Pod 的默认配额为 0。如需使用 TPU Pod 类型,您必须申请评估配额或额外配额。

评估配额

申请评估配额,以便测试 TPU Pod 类型的性能。您使用评估配额创建的 TPU 节点以 1 秒钟为增量进行计费,但不保证能达到与按需 TPU 设备或者您使用承诺配额创建的设备相同的服务等级。评估配额仅在限定期限内对您的项目有效。

申请更多配额

为您的 Google Cloud 项目分配的配额会显示在 Google Cloud Console 中。 如果您需要更多 Cloud TPU 配额,可以按照如下程序,通过 Google Cloud Console 的“配额”页面申请:

  1. 转到配额页面。

    转到“配额”页面

  2. 过滤条件框中,输入 Cloud TPU
  3. 从表中选择每个地区中每个项目的 TPU tpu-version API Pod 核心数 (TPU tpu-version API Pod cores per project per region)。将 tpu-version 替换为您要使用的 TPU 版本。

    您也可以选择每个区域中每个项目的 TPU tpu-version API Pod 核心数 (TPU tpu-version API Pod cores per project per zone)。

  4. 选择要使用 Cloud TPU Pod 的一个或多个地区或区域。

    如需查看每个区域中的可用 TPU 类型的完整列表,请参阅 TPU 类型和区域

  5. 点击修改配额
  6. 填写您的姓名、电子邮件和电话号码,然后点击下一步
  7. 输入您申请增加的具体配额,然后点击下一步
  8. 提交您的申请。

您会在提交申请后的 1-2 个工作日内收到 Cloud TPU 团队的回复。