Cloud TPU 消費選項

本文說明 Cloud TPU 支援的用量選項。用量方案是用來要求容量的方法。選擇用量方案時,請考量下列因素:

  • 您需要運算容量的速度
  • 容量需求時間
  • 您是否需要固定或彈性時間的容量
  • 容量是否可搶占
  • 定價

如果您使用 Cloud TPU API,無論採用哪種消耗方式,您都需要隨選或先占配額,才能使用所需數量的 Cloud TPU 核心。每種 TPU 版本都有不同的預設隨選和先占配額。詳情請參閱 Cloud TPU 配額

如果您搭配 Google Kubernetes Engine (GKE) 使用 TPU,則會使用 Compute Engine API 配額,這是不同的配額。如要進一步瞭解您在 GKE 中使用的 TPU 配額,請參閱「確認您有 TPU 配額」。

用量方案 運作方式 最適用 支援的 TPU 版本和區域 Cloud TPU API 的配額類型
一年以上的未來預留項目

預先申請一年以上的 TPU 資源。在該段時間內,這些資源會保留供您專屬使用。

預留項目可提供最高層級的容量保證,且價格比隨選資源更低,因此具有成本效益。

TPU 未來預留項目會附加承諾使用折扣 (CUD)。只要購買承諾使用合約,即可享有承諾使用折扣。詳情請參閱「申請一年以上的未來預留項目」。

一年以上的預訂項目適合長時間執行的訓練工作和推論工作負載。 所有 TPU 版本:請參閱 TPU 區域和可用區 隨選配額
最多 90 天的未來預訂 (日曆模式) (預覽版)

您可以要求 TPU 資源在特定時間開始,並持續 1 到 90 天。 在該段時間內,這些資源會保留供您專屬使用。

預留項目可提供最高層級的容量保證,且價格比隨選資源更低,因此具有成本效益。

詳情請參閱「在日曆模式中預約最多 90 天後的行程」。

日曆模式中的預訂功能適合需要精確開始時間和固定時長的訓練及實驗工作負載。

v6e (Trillium) 用於訓練和服務:asia-northeast1-b、us-east5-a

v5p,用於訓練和服務:us-east5-a

v5e 訓練:us-west4-a

v5e (用於服務):us-central1-a

無須配額
隨選

您要求盡快使用 TPU 資源,並可自行決定使用時間長度。

以量計價方案的彈性最高,系統不會搶占隨選資源,但無法保證有足夠的可用 TPU 資源來滿足您的要求。建立 TPU 資源時,預設會使用隨選模式。如要進一步瞭解如何建立及使用隨選 TPU,請參閱 管理 TPU 資源

隨選方案適合緊急工作,以及需要彈性結束時間的工作負載。 所有 TPU 版本:請參閱 TPU 區域和可用區 隨選配額
彈性啟動 (預先發布版)

您可要求 TPU 資源一段時間 (最多 7 天),不必事先預留容量。

TPU 彈性啟動 VM 是從專屬的容量集區提供,因此這些資源的可用性高於隨選資源。如要進一步瞭解如何使用 TPU Flex-start VM,請參閱 要求 TPU Flex-start VM

如要進一步瞭解如何搭配使用 TPU 彈性啟動 VM 與 Google Kubernetes Engine (GKE),請參閱「 關於使用彈性啟動佈建模式佈建 GPU 和 TPU」。

彈性啟動 VM 非常適合用於實驗、小規模測試、為推論工作負載動態佈建 TPU、模型微調,以及執行時間少於 7 天的工作負載。

v6e (Trillium):asia-northeast1-b、us-east5-a

v5p:us-east5-a

v5e:us-west4-a

先占配額
Spot

您要求可能會遭到先占的 TPU 資源。

Spot VM 的價格比隨選資源低得多。相較於隨選資源,Spot VM 可能更容易取得,但隨時可能遭到搶占 (關閉)。執行時間長度沒有限制。如要進一步瞭解 TPU Spot VM,請參閱「 管理 TPU Spot VM」。

Spot 適合排定優先順序較低的工作負載,例如模型預先訓練、模型微調和模擬工作,這些工作可容許可用性中斷。 所有 TPU 版本:請參閱 TPU 區域和可用區 先占配額

後續步驟

使用下列方式開始使用 TPU: