Cloud TPU の割り当て

このドキュメントでは、Cloud TPU に適用される割り当ての一覧を示します。Cloud TPU の料金については、Cloud TPU の料金をご覧ください。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、Google Cloud プロジェクトで使用できる Google Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

TPU の割り当て

TPU 割り当ては、Google Cloud プロジェクトで使用できる Cloud TPU コアの数の上限です。各バージョンの TPU には独自の割り当てが関連付けられています。また、各 Cloud TPU バージョンの割り当ては、オンデマンド割り当てとプリエンプティブル(またはスポット)割り当てに分かれています。

Cloud TPU リソースを作成するときに、デフォルトでオンデマンド リソースが作成されます。gcloud コマンドを使用してリソースを作成するときに、--spot パラメータを使用してプリエンプティブ リソースを作成できます。詳細については、TPU リソースの管理をご覧ください。

デフォルトの Cloud TPU 割り当て

次の表に、各利用可能なゾーンのオンデマンド割り当てとプリエンプティブ割り当てのデフォルト値を示します。これらの値は、プロジェクト内で使用できる TPU コアの最大数を指定します。

TPU バージョン デフォルトの割り当て(コア数) 割り当て名
v6e 64 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v6e コア数
v5p 768 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5p コア数
v5e 64 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5 Lite Pod コア数
v4 0 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v4 Pod コア数
v3 Pod 32 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 Pod コア数
v3 120 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 コア数
v2 Pod 32 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 Pod コア数
v2 120 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 コア数
TPU バージョン デフォルトの割り当て(コア数) 割り当て名
v6e 32 コア 1 ゾーン、1 プロジェクトあたりの TPU v6e コア数
v5p 128 コア 1 ゾーン、1 プロジェクトあたりの TPU v5p コア数
v5e 32 コア 1 ゾーン、1 プロジェクトあたりの TPU v5 Lite Pod コア数
v4 0 コア 1 ゾーン、1 プロジェクトあたりの TPU v4 Pod コア数
v3 Pod 32 コア 1 ゾーン、1 プロジェクトあたりの TPU v3 Pod コア数
v3 40 コア 1 ゾーン、1 プロジェクトあたりの TPU v3 コア数
v2 Pod 32 コア 1 ゾーン、1 プロジェクトあたりの TPU v2 コア数
v2 40 コア 1 ゾーン、1 プロジェクトあたりの TPU v2 Pod コア数

追加割り当てを表示、リクエストする

プロジェクトに割り当てられた割り当ては、Google Cloud コンソールの [割り当て] ページで確認できます。 Google Cloud

Cloud TPU の割り当ての増加は、[割り当て] ページからリクエストできます。増やす割り当てを見つけて、その他アイコンをクリックし、[割り当てを編集] を選択します。詳細については、割り当て上限の引き上げをリクエストするをご覧ください。自動承認のしきい値を下回る割り当てをリクエストすると、リクエストは自動的に承認されます。

TPU バージョン 自動承認の基準値 割り当て名
v6e すべてのゾーン: 0 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v6e コア数
v5p すべてのゾーン: 0 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5p コア数
v5e
  • us-east5-b: 800 コア
  • us-west4-a: 1,600 コア
  • us-west4-b: 3,968 コア
  • us-west1-c: 576 コア
  • us-central1-a: 3,264 コア
  • europe-west4-a: 4,032 コア
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5 Lite Pod コア数
v4 すべてのゾーン: 0 コア 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v4 Pod コア数
v3 Pod
  • europe-west4-a: 512 コア
  • us-east1-d: 320 コア
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 Pod コア数
v3
  • us-central1-a: 64 コア
  • europe-west4-a: 128 コア
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 コア数
v2 Pod
  • us-central1-a: 64 コア
  • europe-west4-a: 64 コア
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 Pod コア数
v2
  • us-central1-b: 128 コア
  • us-central1-c: 64 コア
  • us-central1-f: 128 コア
  • europe-west4-a: 32 コア
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 コア数
TPU バージョン 自動承認の基準値 割り当て名
v6e すべてのゾーン: 0 コア 1 ゾーン、1 プロジェクトあたりの TPU v6e コア数
v5p us-east5-a: 64 コア 1 ゾーン、1 プロジェクトあたりの TPU v5p コア数
v5e すべてのゾーン: 64 コア 1 ゾーン、1 プロジェクトあたりの TPU v5 Lite Pod コア数
v4 すべてのゾーン: 0 コア 1 ゾーン、1 プロジェクトあたりの TPU v4 Pod コア数
v3 Pod
  • europe-west4-a: 128 コア
  • us-east1-d: 64 コア
1 ゾーン、1 プロジェクトあたりの TPU v3 Pod コア数
v3
  • us-central1-a: 64 コア
  • europe-west4-a: 128 コア
1 ゾーン、1 プロジェクトあたりの TPU v3 コア数
v2 Pod
  • us-central1-a: 64 コア
  • europe-west4-a: 64 コア
1 ゾーン、1 プロジェクトあたりの TPU v2 コア数
v2
  • us-central1-b: 128 コア
  • us-central1-c: 64 コア
  • us-central1-f: 128 コア
  • europe-west4-a: 32 コア
1 ゾーン、1 プロジェクトあたりの TPU v2 Pod コア数

割り当てリクエストが承認されたか拒否されたかを通知するメールが届きます。サービス割り当ての増加は段階的に行われます。Google Cloud これにより、さまざまなリージョンやリソースでロールアウトが進行する可能性があります。ロールアウト中、Google Cloud コンソールまたは Cloud Quotas API で表示される割り当て値は、ロールアウトが完了するまで、引き上げ後の新しい割り当て値を反映しません。詳細については、進行中のロールアウトを表示するをご覧ください。