割り当て

このドキュメントでは、Cloud TPU に適用される割り当ての一覧を示します。Cloud TPU の料金については、Cloud TPU の料金をご覧ください。

割り当ては、Google Cloud プロジェクトで使用できる特定の共有 Google Cloud リソース(ハードウェア、ソフトウェア、ネットワーク コンポーネントなど)の量を制限します。

割り当てはシステムの一部で、次の機能があります。

  • Google Cloud のプロダクトとサービスの使用量や消費量をモニタリングする。
  • 公平性の確保や使用量急増の抑制などのため、これらのリソースの消費量を制限する。
  • 規定の制限を自動的に適用する構成を維持する。
  • 割り当ての変更を実施またはリクエストする手段を提供する。

割り当てを超過すると、ほとんどの場合、システムは関連する Google リソースへのアクセスをすぐにブロックするため、ユーザーが試行しているタスクは失敗します。ほとんどの場合、割り当ては各 Google Cloud プロジェクトに適用され、その Google Cloud プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。

割り当て

割り当ての方式は、使用している TPU のバージョンに応じて異なります。TPU v4 以降の場合、割り当ては Cloud TPU チップまたは TensorCore の数で指定します。TPU v4 はすべてスライスとして扱われるため、単一の TPU デバイスというコンセプトはありません。v4 割り当ては、スライスの任意の組み合わせで使用できます。たとえば、v4-32 スライスの割り当てがある場合は、この割り当てを使用して 4 つの v4-8 スライスを作成できます。

TPU v2 および v3 の場合、割り当ては TensorCore の数で指定します。1 個の Cloud TPU デバイスは、4 個の TPU チップと 8 個の TensorCore(TPU チップあたり 2 個の TensorCore)で構成されています。TPU v2 と v3 の割り当ては、単一デバイスと TPU Pod で異なります。v2-8 または v3-8 の TPU には v2 または v3 の TPU Pod の割り当てを使用できません。たとえば、v3-32 スライスの割り当てがある場合、このスライスを使用して 4 つの v3-8 TPU を作成することはできません。

TPU チップと TensorCore の詳細については、TPU システム アーキテクチャをご覧ください。

割り当てタイプ

Cloud TPU の予約リソース、オンデマンド リソース、プリエンプティブル リソースには、個別の割り当てがあります。次の表は、各タイプの割り当ての特徴を比較したものです。

割り当てのタイプ 説明 デフォルト値 リクエスト方法 TPU 作成のフラグ
予約済み 予約済みの TPU の割り当て。予約を使用すると、Cloud TPU の容量を確実に確保できます。予約済みインスタンスは在庫切れから保護されますが、中断される可能性があります。予約済みリソースにアクセスするには、確約利用割引(CUD)が必要です。 0 予約をリクエストするには、Cloud TPU 登録フォームに記入します。 --reserved フラグを使用します。
オンデマンド 予約されず、プリエンプトされない TPU の割り当て。Cloud TPU リソースの割り当て上限までリクエストできますが、リソースの可用性は保証されません。 v3-8 と v2-8: 16 個の TensorCore
その他すべて: 0 個
追加の割り当てをリクエストするをご覧ください。 フラグは必要ありません。デフォルトで選択されます。
プリエンプティブル プリエンプティブル TPU の割り当て。優先度の高いジョブに追加のリソースが必要な場合は、Cloud TPU サービスによってこれらの TPU が随時シャットダウンされる可能性があります。リソースの可用性は保証されません。詳細については、プリエンプティブル TPU をご覧ください。 v3-8 と v2-8: 48 個の TensorCore
その他すべて: 0 個
追加の割り当てをリクエストするをご覧ください。 キューに格納されたリソースのリクエストには、--preemptible フラグまたは --best-effort フラグを使用します。

追加割り当てを表示、リクエストする

Google Cloud プロジェクトに与えられた割り当ては、Google Cloud コンソールの [割り当て] ページで確認できます。Cloud TPU の割り当ての増加が必要な場合は、[割り当て] ページからリクエストできます。詳細については、割り当て上限の引き上げをリクエストするをご覧ください。