Cloud TPU 配額

本文列出 Cloud TPU 適用的配額。如要瞭解 Cloud TPU 定價,請參閱 Cloud TPU 定價

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud Quotas 系統會執行下列操作:

在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。

配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。

」一文。

TPU 配額

TPU 配額是指您可透過Google Cloud 專案使用的 Cloud TPU 核心數量上限。每個 TPU 版本都有專屬配額。此外,每個 Cloud TPU 版本配額都分為隨選配額和可搶占 (或現貨) 配額。

建立 Cloud TPU 資源時,預設會建立隨選資源。使用 gcloud 指令建立資源時,可以透過 --spot 參數建立先佔資源。詳情請參閱「管理 TPU 資源」。

Cloud TPU 預設配額

下表列出各可用區的隨需和先占配額預設值。這些值指定了專案中可使用的 TPU 核心數量上限。

先占配額

TPU 版本 預設配額 (核心數量) 配額名稱
v6e 1536 個核心 每個可用區中每項專案的先占 TPU v6e 核心
v5p 768 個核心 每個可用區中每項專案的先占 TPU v5p 核心
v5e 1536 個核心 每個可用區中每項專案的先占 TPU v5 Lite Pod 核心
v4 0 個核心 每個可用區中每項專案的先占 TPU v4 Pod 核心
v3 Pod 32 個核心 每個可用區中每項專案的先占 TPU v3 Pod 核心
v3 120 個核心 每個可用區中每項專案的先占 TPU v3 核心
v2 Pod 32 個核心 每個區域中每項專案的先占 TPU v2 Pod 核心
v2 120 個核心 每個可用區中每項專案的先占 TPU v2 核心

隨選配額

TPU 版本 預設配額 (核心數量) 配額名稱
v6e 512 個核心 每個可用區中每項專案的 TPU v6e 核心
v5p 128 個核心 每個區域中每項專案的 TPU v5p 核心
v5e 512 個核心 每個區域中每項專案的 TPU v5 LitePod 核心數
v4 0 個核心 每個區域中每項專案的 TPU v4 Pod 核心
v3 Pod 32 個核心 每個可用區中每項專案的 TPU v3 Pod 核心
v3 40 個核心 每個可用區中每項專案的 TPU v3 核心數
v2 Pod 32 個核心 每個可用區中每項專案的 TPU v2 Pod 核心
v2 40 個核心 每個可用區中每項專案的 TPU v2 核心數

查看及要求額外配額

您可以在 Google Cloud 控制台的「配額」頁面,查看 Google Cloud 專案的配額。

如需更多 Cloud TPU 配額,請前往「配額」頁面提出申請。找出要增加的配額,按一下垂直排列的三個點,然後選擇「編輯配額」。詳情請參閱「要求調整配額」。如果要求的配額低於自動核准門檻,系統會自動核准要求。

先占配額

TPU 版本 自動核准門檻 配額名稱
v6e 所有可用區:0 個核心 每個可用區中每項專案的先占 TPU v6e 核心
v5p 所有可用區:0 個核心 每個可用區中每項專案的先占 TPU v5p 核心
v5e
  • us-east5-b:800 個核心
  • us-west4-a:1600 個核心
  • us-west4-b:3968 個核心
  • us-west1-c:576 個核心
  • us-central1-a:3264 個核心
  • europe-west4-a:4032 個核心
每個可用區中每項專案的先占 TPU v5 Lite Pod 核心
v4 所有可用區:0 個核心 每個可用區中每項專案的先占 TPU v4 Pod 核心
v3 Pod
  • europe-west4-a:512 個核心
  • us-east1-d:320 個核心
每個可用區中每項專案的先占 TPU v3 Pod 核心
v3
  • us-central1-a:64 個核心
  • europe-west4-a:128 個核心
每個可用區中每項專案的先占 TPU v3 核心
v2 Pod
  • us-central1-a:64 個核心
  • europe-west4-a:64 個核心
每個區域中每項專案的先占 TPU v2 Pod 核心
v2
  • us-central1-b:128 個核心
  • us-central1-c:64 核心
  • us-central1-f:128 個核心
  • europe-west4-a:32 個核心
每個可用區中每項專案的先占 TPU v2 核心

隨選配額

TPU 版本 自動核准門檻 配額名稱
v6e 所有可用區:0 個核心 每個可用區中每項專案的 TPU v6e 核心
v5p us-east5-a:64 核心 每個區域中每項專案的 TPU v5p 核心
v5e 所有可用區:64 個核心 每個區域中每項專案的 TPU v5 LitePod 核心數
v4 所有可用區:0 個核心 每個區域中每項專案的 TPU v4 Pod 核心
v3 Pod
  • europe-west4-a:128 個核心
  • us-east1-d:64 個核心
每個可用區中每項專案的 TPU v3 Pod 核心
v3
  • us-central1-a:64 個核心
  • europe-west4-a:128 個核心
每個可用區中每項專案的 TPU v3 核心數
v2 Pod
  • us-central1-a:64 個核心
  • europe-west4-a:64 個核心
每個可用區中每項專案的 TPU v2 Pod 核心
v2
  • us-central1-b:128 個核心
  • us-central1-c:64 核心
  • us-central1-f:128 個核心
  • europe-west4-a:32 個核心
每個可用區中每項專案的 TPU v2 核心數

您會收到電子郵件,通知配額要求是否獲得核准。 Google Cloud 服務配額會逐步增加。這可能會導致不同區域或資源持續推出。推出期間, Google Cloud 控制台或 Cloud Quotas API 中顯示的配額值,在推出完成前不會反映新的配額值。詳情請參閱「查看進行中的推出作業」。