Cloud TPU 配額
本文列出 Cloud TPU 適用的配額。如要瞭解 Cloud TPU 定價,請參閱 Cloud TPU 定價。
Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。
Cloud Quotas 系統會執行下列操作:
在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。
配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。
詳情請參閱 Cloud Quotas 總覽。 」一文。TPU 配額
TPU 配額是指您可透過Google Cloud 專案使用的 Cloud TPU 核心數量上限。每個 TPU 版本都有專屬配額。此外,每個 Cloud TPU 版本配額都分為隨選配額和可搶占 (或現貨) 配額。
建立 Cloud TPU 資源時,預設會建立隨選資源。使用 gcloud
指令建立資源時,可以透過 --spot
參數建立先佔資源。詳情請參閱「管理 TPU 資源」。
Cloud TPU 預設配額
下表列出各可用區的隨需和先占配額預設值。這些值指定了專案中可使用的 TPU 核心數量上限。
先占配額
TPU 版本 | 預設配額 (核心數量) | 配額名稱 |
---|---|---|
v6e | 1536 個核心 | 每個可用區中每項專案的先占 TPU v6e 核心 |
v5p | 768 個核心 | 每個可用區中每項專案的先占 TPU v5p 核心 |
v5e | 1536 個核心 | 每個可用區中每項專案的先占 TPU v5 Lite Pod 核心 |
v4 | 0 個核心 | 每個可用區中每項專案的先占 TPU v4 Pod 核心 |
v3 Pod | 32 個核心 | 每個可用區中每項專案的先占 TPU v3 Pod 核心 |
v3 | 120 個核心 | 每個可用區中每項專案的先占 TPU v3 核心 |
v2 Pod | 32 個核心 | 每個區域中每項專案的先占 TPU v2 Pod 核心 |
v2 | 120 個核心 | 每個可用區中每項專案的先占 TPU v2 核心 |
隨選配額
TPU 版本 | 預設配額 (核心數量) | 配額名稱 |
---|---|---|
v6e | 512 個核心 | 每個可用區中每項專案的 TPU v6e 核心 |
v5p | 128 個核心 | 每個區域中每項專案的 TPU v5p 核心 |
v5e | 512 個核心 | 每個區域中每項專案的 TPU v5 LitePod 核心數 |
v4 | 0 個核心 | 每個區域中每項專案的 TPU v4 Pod 核心 |
v3 Pod | 32 個核心 | 每個可用區中每項專案的 TPU v3 Pod 核心 |
v3 | 40 個核心 | 每個可用區中每項專案的 TPU v3 核心數 |
v2 Pod | 32 個核心 | 每個可用區中每項專案的 TPU v2 Pod 核心 |
v2 | 40 個核心 | 每個可用區中每項專案的 TPU v2 核心數 |
查看及要求額外配額
您可以在 Google Cloud 控制台的「配額」頁面,查看 Google Cloud 專案的配額。
如需更多 Cloud TPU 配額,請前往「配額」頁面提出申請。找出要增加的配額,按一下垂直排列的三個點,然後選擇「編輯配額」。詳情請參閱「要求調整配額」。如果要求的配額低於自動核准門檻,系統會自動核准要求。
先占配額
TPU 版本 | 自動核准門檻 | 配額名稱 |
---|---|---|
v6e | 所有可用區:0 個核心 | 每個可用區中每項專案的先占 TPU v6e 核心 |
v5p | 所有可用區:0 個核心 | 每個可用區中每項專案的先占 TPU v5p 核心 |
v5e |
|
每個可用區中每項專案的先占 TPU v5 Lite Pod 核心 |
v4 | 所有可用區:0 個核心 | 每個可用區中每項專案的先占 TPU v4 Pod 核心 |
v3 Pod |
|
每個可用區中每項專案的先占 TPU v3 Pod 核心 |
v3 |
|
每個可用區中每項專案的先占 TPU v3 核心 |
v2 Pod |
|
每個區域中每項專案的先占 TPU v2 Pod 核心 |
v2 |
|
每個可用區中每項專案的先占 TPU v2 核心 |
隨選配額
TPU 版本 | 自動核准門檻 | 配額名稱 |
---|---|---|
v6e | 所有可用區:0 個核心 | 每個可用區中每項專案的 TPU v6e 核心 |
v5p | us-east5-a:64 核心 | 每個區域中每項專案的 TPU v5p 核心 |
v5e | 所有可用區:64 個核心 | 每個區域中每項專案的 TPU v5 LitePod 核心數 |
v4 | 所有可用區:0 個核心 | 每個區域中每項專案的 TPU v4 Pod 核心 |
v3 Pod |
|
每個可用區中每項專案的 TPU v3 Pod 核心 |
v3 |
|
每個可用區中每項專案的 TPU v3 核心數 |
v2 Pod |
|
每個可用區中每項專案的 TPU v2 Pod 核心 |
v2 |
|
每個可用區中每項專案的 TPU v2 核心數 |
您會收到電子郵件,瞭解配額要求是否獲得核准。 Google Cloud 服務配額會逐步增加。這可能會導致不同區域或資源持續推出。推出期間, Google Cloud 控制台或 Cloud Quotas API 中顯示的配額值,在推出完成前不會反映新的配額值。詳情請參閱「查看進行中的推出作業」。