使用日历模式请求短期预订

如需预留特定开始时间和时长(1 天到 90 天)的 TPU,请在日历模式下请求未来预留。此模式由动态工作负载调度器提供支持,可让您最多提前 120 天查看 TPU 可用性,并根据您的时间表请求容量。您可以使用 Compute Engine API 或 Google Cloud 控制台在日历模式下请求未来预留。如果获得批准,Compute Engine 会自动为您选择的日期和时间创建预留。然后,您可以使用 Create Node APIQueued Resources API 预配 TPU,从而消耗预留。Compute Engine 会在预留期结束时自动删除预留以及使用该预留的所有 TPU。

在日历模式下请求未来预留非常适合需要精确开始时间且具有明确时长的训练和实验工作负载。

如需了解详情,请参阅关于日历模式下的未来预留请求

查看 TPU 的未来可用性

您可以提前 1 到 120 天查看 TPU 的可用性。如需了解详情,请参阅查看资源的未来可用性

在日历模式下创建未来预留请求

您可以使用 Compute Engine API 或 Google Cloud 控制台在日历模式下请求未来预留。如需了解详情,请参阅在日历模式下创建未来预订请求

限制

在日历模式下为 TPU 申请未来预留存在以下限制:

  • 您无法修改、取消或删除未来预留请求。
  • 您必须指定预订时长,最短为 1 天,最长为 90 天。
  • 您只能在指定区域预订以下 TPU 版本:
    • TPU v6e:asia-northeast1-b、us-east5-a
    • TPU v5p:us-east5-a
    • TPU v5e:us-west4-b (BATCH)、us-central1-a (SERVING)

如需了解每个请求允许的 TPU 芯片数量,请参阅 Compute Engine 文档中的限制

后续步骤