Cloud TPU の割り当て
このドキュメントでは、Cloud TPU に適用される割り当ての一覧を示します。Cloud TPU の料金については、Cloud TPU の料金をご覧ください。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、Google Cloud プロジェクトで使用できる Google Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud プロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
TPU の割り当て
TPU 割り当ては、Google Cloud プロジェクトで使用できる Cloud TPU コアの数の上限です。各バージョンの TPU には独自の割り当てが関連付けられています。また、各 Cloud TPU バージョンの割り当ては、オンデマンド割り当てとプリエンプティブル(またはスポット)割り当てに分かれています。
Cloud TPU リソースを作成するときに、デフォルトでオンデマンド リソースが作成されます。gcloud
コマンドを使用してリソースを作成するときに、--spot
パラメータを使用してプリエンプティブ リソースを作成できます。詳細については、TPU リソースの管理をご覧ください。
デフォルトの Cloud TPU 割り当て
次の表に、各利用可能なゾーンのオンデマンド割り当てとプリエンプティブ割り当てのデフォルト値を示します。これらの値は、プロジェクト内で使用できる TPU コアの最大数を指定します。
TPU バージョン | デフォルトの割り当て(コア数) | 割り当て名 |
---|---|---|
v6e | 64 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v6e コア数 |
v5p | 768 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5p コア数 |
v5e | 64 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5 Lite Pod コア数 |
v4 | 0 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v4 Pod コア数 |
v3 Pod | 32 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 Pod コア数 |
v3 | 120 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 コア数 |
v2 Pod | 32 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 Pod コア数 |
v2 | 120 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 コア数 |
TPU バージョン | デフォルトの割り当て(コア数) | 割り当て名 |
---|---|---|
v6e | 32 コア | 1 ゾーン、1 プロジェクトあたりの TPU v6e コア数 |
v5p | 128 コア | 1 ゾーン、1 プロジェクトあたりの TPU v5p コア数 |
v5e | 32 コア | 1 ゾーン、1 プロジェクトあたりの TPU v5 Lite Pod コア数 |
v4 | 0 コア | 1 ゾーン、1 プロジェクトあたりの TPU v4 Pod コア数 |
v3 Pod | 32 コア | 1 ゾーン、1 プロジェクトあたりの TPU v3 Pod コア数 |
v3 | 40 コア | 1 ゾーン、1 プロジェクトあたりの TPU v3 コア数 |
v2 Pod | 32 コア | 1 ゾーン、1 プロジェクトあたりの TPU v2 コア数 |
v2 | 40 コア | 1 ゾーン、1 プロジェクトあたりの TPU v2 Pod コア数 |
追加割り当てを表示、リクエストする
プロジェクトに割り当てられた割り当ては、Google Cloud コンソールの [割り当て] ページで確認できます。 Google Cloud
Cloud TPU の割り当ての増加は、[割り当て] ページからリクエストできます。増やす割り当てを見つけて、その他アイコンをクリックし、[割り当てを編集] を選択します。詳細については、割り当て上限の引き上げをリクエストするをご覧ください。自動承認のしきい値を下回る割り当てをリクエストすると、リクエストは自動的に承認されます。
TPU バージョン | 自動承認の基準値 | 割り当て名 |
---|---|---|
v6e | すべてのゾーン: 0 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v6e コア数 |
v5p | すべてのゾーン: 0 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5p コア数 |
v5e |
|
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v5 Lite Pod コア数 |
v4 | すべてのゾーン: 0 コア | 1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v4 Pod コア数 |
v3 Pod |
|
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 Pod コア数 |
v3 |
|
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v3 コア数 |
v2 Pod |
|
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 Pod コア数 |
v2 |
|
1 ゾーン、1 プロジェクトあたりのプリエンプティブル TPU v2 コア数 |
TPU バージョン | 自動承認の基準値 | 割り当て名 |
---|---|---|
v6e | すべてのゾーン: 0 コア | 1 ゾーン、1 プロジェクトあたりの TPU v6e コア数 |
v5p | us-east5-a: 64 コア | 1 ゾーン、1 プロジェクトあたりの TPU v5p コア数 |
v5e | すべてのゾーン: 64 コア | 1 ゾーン、1 プロジェクトあたりの TPU v5 Lite Pod コア数 |
v4 | すべてのゾーン: 0 コア | 1 ゾーン、1 プロジェクトあたりの TPU v4 Pod コア数 |
v3 Pod |
|
1 ゾーン、1 プロジェクトあたりの TPU v3 Pod コア数 |
v3 |
|
1 ゾーン、1 プロジェクトあたりの TPU v3 コア数 |
v2 Pod |
|
1 ゾーン、1 プロジェクトあたりの TPU v2 コア数 |
v2 |
|
1 ゾーン、1 プロジェクトあたりの TPU v2 Pod コア数 |
割り当てリクエストが承認されたか拒否されたかを通知するメールが届きます。サービス割り当ての増加は段階的に行われます。Google Cloud これにより、さまざまなリージョンやリソースでロールアウトが進行する可能性があります。ロールアウト中、Google Cloud コンソールまたは Cloud Quotas API で表示される割り当て値は、ロールアウトが完了するまで、引き上げ後の新しい割り当て値を反映しません。詳細については、進行中のロールアウトを表示するをご覧ください。