Cloud TPU の割り当て

このドキュメントでは、Cloud TPU に適用される割り当てについて説明します。Cloud TPU の料金については、Cloud TPU の料金をご覧ください。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワークコンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

Google Cloud のプロダクトとサービスの消費量をモニタリングする
これらのリソースの消費量を制限する
割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクトレベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

TPU の割り当て

TPU の割り当ては、Google Cloud プロジェクトで使用できる Cloud TPU コアの数の上限です。各バージョンの TPU には独自の割り当てが関連付けられています。また、各 Cloud TPU バージョンの割り当ては、オンデマンド割り当てとプリエンプティブル（またはスポット）割り当てに分かれています。

Cloud TPU リソースを作成するときに、デフォルトでオンデマンドリソースが作成されます。gcloud コマンドを使用してリソースを作成するときに、--spot パラメータを使用してプリエンプティブリソースを作成できます。詳細については、TPU リソースの管理をご覧ください。

Cloud TPU のデフォルトの割り当て

次の表に、各利用可能なゾーンのオンデマンド割り当てとプリエンプティブ割り当てのデフォルト値を示します。これらの値は、プロジェクト内で使用できる TPU コアの最大数を指定します。

プリエンプティブル割り当て

TPU バージョン	デフォルトの割り当て（コア数）	割り当て名
v6e	1,536 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v6e コア数
v5p	768 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5p コア数
v5e	1,536 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5 Lite Pod コア数
v4	0 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v4 Pod コア数
v3 Pod	32 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 Pod コア数
v3	120 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 コア数
v2 Pod	32 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 Pod コア数
v2	120 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 コア数

オンデマンドの割り当て

TPU バージョン	デフォルトの割り当て（コア数）	割り当て名
v6e	512 コア	1 ゾーン、1 プロジェクトあたりの TPU v6e コア数
v5p	128 コア	1 ゾーン、1 プロジェクトあたりの TPU v5p コア数
v5e	512 コア	1 ゾーン、1 プロジェクトあたりの TPU v5 Lite Pod コア数
v4	0 コア	1 ゾーン、1 プロジェクトあたりの TPU v4 Pod コア数
v3 Pod	32 コア	1 ゾーン、1 プロジェクトあたりの TPU v3 Pod コア数
v3	40 コア	1 ゾーン、1 プロジェクトあたりの TPU v3 コア数
v2 Pod	32 コア	1 ゾーン、1 プロジェクトあたりの TPU v2 Pod コア数
v2	40 コア	1 ゾーン、1 プロジェクトあたりの TPU v2 コア数

追加割り当ての表示とリクエスト

Google Cloud プロジェクトに割り当てられた割り当ては、 Google Cloud コンソールの [割り当て] ページで確認できます。

Cloud TPU の割り当ての増加は、[割り当て] ページからリクエストできます。増やす割り当てを見つけて、その他アイコンをクリックし、[割り当てを編集] を選択します。詳細については、割り当ての調整をリクエストするをご覧ください。自動承認のしきい値を下回る割り当てをリクエストすると、リクエストは自動的に承認されます。

プリエンプティブル割り当て

TPU バージョン	自動承認の基準値	割り当て名
v6e	すべてのゾーン: 0 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v6e コア数
v5p	すべてのゾーン: 0 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5p コア数
v5e	us-east5-b: 800 コア us-west4-a: 1,600 コア us-west4-b: 3,968 コア us-west1-c: 576 コア us-central1-a: 3,264 コア europe-west4-a: 4,032 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5 Lite Pod コア数
v4	すべてのゾーン: 0 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v4 Pod コア数
v3 Pod	europe-west4-a: 512 コア us-east1-d: 320 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 Pod コア数
v3	us-central1-a: 64 コア europe-west4-a: 128 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 コア数
v2 Pod	us-central1-a: 64 コア europe-west4-a: 64 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 Pod コア数
v2	us-central1-b: 128 コア us-central1-c: 64 コア us-central1-f: 128 コア europe-west4-a: 32 コア	1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 コア数

オンデマンドの割り当て

TPU バージョン	自動承認の基準値	割り当て名
v6e	すべてのゾーン: 0 コア	1 ゾーン、1 プロジェクトあたりの TPU v6e コア数
v5p	us-east5-a: 64 コア	1 ゾーン、1 プロジェクトあたりの TPU v5p コア数
v5e	すべてのゾーン: 64 コア	1 ゾーン、1 プロジェクトあたりの TPU v5 Lite Pod コア数
v4	すべてのゾーン: 0 コア	1 ゾーン、1 プロジェクトあたりの TPU v4 Pod コア数
v3 Pod	europe-west4-a: 128 コア us-east1-d: 64 コア	1 ゾーン、1 プロジェクトあたりの TPU v3 Pod コア数
v3	us-central1-a: 64 コア europe-west4-a: 128 コア	1 ゾーン、1 プロジェクトあたりの TPU v3 コア数
v2 Pod	us-central1-a: 64 コア europe-west4-a: 64 コア	1 ゾーン、1 プロジェクトあたりの TPU v2 Pod コア数
v2	us-central1-b: 128 コア us-central1-c: 64 コア us-central1-f: 128 コア europe-west4-a: 32 コア	1 ゾーン、1 プロジェクトあたりの TPU v2 コア数

割り当てリクエストが承認されたか拒否されたかを通知するメールが届きます。Google Cloud サービスの割り当ての増加は段階的に行われます。これにより、さまざまなリージョンやリソースでロールアウトが進行する可能性があります。ロールアウト中、 Google Cloud コンソールまたは Cloud Quotas API で表示される割り当て値には、ロールアウトが完了するまで、引き上げ後の新しい割り当て値が反映されません。詳細については、進行中のロールアウトを表示するをご覧ください。