キューに格納されたリソースのユーザーガイド

キューに格納されたリソースを使用すると、Cloud TPU リソースをキューに格納してリクエストできます。キューに格納されたリソースをリクエストすると、リクエストは Cloud TPU サービスによって管理されるキューに追加されます。リクエストされたリソースが使用可能になると、すぐに Google Cloud プロジェクトに割り当てられ、すぐに専用で使用できるようになります。プロジェクトを削除またはプリエンプトしない限り、プロジェクトに割り当てられたままになります。プリエンプションの対象は TPU Spot VM とプリエンプティブル TPU のみとなります。

キューに入れられたリソース リクエストで、開始時刻や終了時刻(オプション)を指定できます。開始時刻は、リクエストを入力できる最も早い時刻を指定します。指定された終了時刻までにリクエストが入力されていない場合、リクエストは期限切れになります。リクエストは有効期限が切れた後もキュー内に残ります。

キューに格納されたリソース リクエストは、次のいずれかの状態になります。

WAITING_FOR_RESOURCES
リクエストは最初の検証に合格し、キューに追加されました。この状態は、リクエストのプロビジョニングを開始するのに十分な空きリソースがあるか、割り当て区間が経過するまで維持されます。需要が高い場合、すべてのリクエストをすぐにプロビジョニングできるわけではありません。TPU の信頼性を高める必要がある場合は、予約の購入を検討してください。
PROVISIONING
リクエストがキューから選択され、リソースが割り当てられています。
ACTIVE
リクエストが割り当てられました。キューに格納されたリソース リクエストが ACTIVE 状態になると、TPU を管理するの説明に従って TPU VM を管理できます。
FAILED
リクエストに問題があるか、リクエストされたリソースが割り当て区間内で使用できないため、リクエストを完了できませんでした。リクエストは、明示的に削除されるまでキューに残ります。
SUSPENDING
リクエストに関連付けられているリソースが削除されています。
SUSPENDED
リクエストで指定されたリソースが削除されました。リクエストが SUSPENDED 状態になると、それ以上の割り当ての対象外になります。

前提条件

このガイドのコマンドを実行する前に、次のことを行ってください。

キューに入れられたオンデマンド リソースをリクエストする

キューに入れられたオンデマンド リソースをリクエストするには、gcloud compute tpus queued-resources create コマンドを使用します。オンデマンド リソースの詳細については、割り当てタイプをご覧ください。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
Google Cloud プロジェクト
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。

キューに格納されたオンデマンド リソースのデフォルトのスライスサイズ

オンデマンド割り当てを使用する場合は、使用しているアクセラレータ タイプのデフォルトの上限よりも小さいスライスサイズをリクエストする必要があります。デフォルトの上限を超えるリクエストは、システムによって拒否されます。

次の表に、TPU タイプごとのデフォルトの上限を示します。

アクセラレータ タイプ デフォルトの上限(TensorCore の数)
v2 128
v3 128
v4 384
v5 32

より大きなスライスサイズが必要な場合は、Cloud TPU サポートに詳細をお問い合わせください。

予約を使用してキューに格納されたリソースをリクエストする

予約を使用して、キューに格納されたリソースをリクエストするには、gcloud コマンドで --reserved フラグを指定するか、curl リクエストで guaranteed.reserved=true を指定します。予約を購入するには、Google Cloud アカウント チームにお問い合わせください。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
Google Cloud プロジェクト
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
reserved
このフラグは、Cloud TPU 予約の一部としてキュー内のリソースをリクエストするときに使用します。

キューに入れられた TPU Spot VM のリソースをリクエストする

Spot VM は、いつでもプリエンプトして別のワークロードに割り当てることができるリソースです。Spot VM のリソースは低コストで、Spot VM 以外のリクエストよりも早くリソースにアクセスできる場合があります。TPU Spot VM の詳細については、TPU Spot VM を管理するをご覧ください。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
リクエストに応答して作成された TPU のユーザー定義 ID。
project
キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
spot
キューに入れられたリソースが Spot VM であることを指定するブール値のフラグ。

指定した時間の前後にキューに入れられたリソースを割り当てるようリクエストする

キューに入れられたリソース リクエストで、必要に応じて開始時刻終了時刻開始時間終了時間を指定できます。開始時刻または開始時間は、リクエストを入力する最も早い時刻を指定します。指定した終了時刻までに、または指定した期間内にリクエストが入力されていない場合、リクエストは期限切れになります。リクエストの有効期限が切れると、キューには残りますが、割り当ての対象外になります。

開始時刻または期間と終了時刻または期間を指定して、割り当て間隔を指定することもできます。

サポートされているタイムスタンプと期間の形式の一覧については、日時をご覧ください。

指定した時間内にキューに格納されたリソースをリクエストする

--valid-after-duration フラグを使用して、経過後にリソースを割り当てる期間を指定できます。次の例では、v4-32 を 6 時間後に割り当てるようリクエストします。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
リクエストに応答して作成された TPU のユーザー定義 ID。
project
キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
valid-after-duration
経過するまでの間 TPU をプロビジョニングできない期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。

指定した期間の経過後に期限切れとなるキューに格納されたリソースをリクエストする

キューに入れられたリソース リクエストの有効期間は、--valid-until-duration フラグを使用して指定できます。次の例では、6 時間の内に入力しないと期限切れになる v4-32 をリクエストします。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
リクエストに応答して作成された TPU のユーザー定義 ID。
project
キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
valid-until-duration
リクエストが有効である期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。

指定した時間の経過後にキューに格納されたリソースをリクエストする

--valid-after-time フラグを使用して、リソースを割り当てる時間を指定できます。

次のコマンドは、ランタイム バージョン tpu-vm-tf-2.17.0-pjrt の v4-4096 TPU を 2022 年 12 月 14 日午前 9 時以降に割り当てるようリクエストします。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-4096 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
リクエストに応答して作成された TPU のユーザー定義 ID。
project
キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
valid-after-time
リソースが割り当てられるべき時間。期間の形式の詳細については、Google Cloud CLI topic datetime をご覧ください。

指定した時間が経過するまでにキューに格納されたリソースをリクエストする

--valid-until-time フラグを使用して、リソースの割り当てを行う必要がある期限に該当する時刻を指定できます。

次のコマンドは、ランタイム バージョン tpu-vm-tf-2.10.0-pod の v4-4096 TPU を、2022 年 12 月 14 日午前 9 時までに作成するようリクエストします。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-4096 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
リクエストに応答して作成された TPU のユーザー定義 ID。
project
キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
valid-until-time
それ以降はリクエストがキャンセルされる時間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。

キューに格納されたリソースを指定された時間内に割り当てるようリクエストする

--valid-after-time--valid-after-duration--valid-until-duration--valid-until-time フラグのうち、1 つが割り当て区間の開始を、もう 1 つが割り当て区間の終了を指定するものであれば、任意の組を使って割り当て区間を指定することができます。

次のコマンドは、現在の時刻から 5 時間 30 分後で、2022 年 12 月 14 日午前 9 時までに v4-32 を作成するようリクエストします。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-duration 5h30m \
  --valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンドフラグの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
リクエストに応答して作成された TPU のユーザー定義 ID。
project
キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
valid-until-timw
それ以降はリクエストがキャンセルされる時間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
valid-until-duration
リクエストが有効である期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。

起動スクリプトでキューに格納されたリソースをリクエストする

キューに格納されたリソースに対してプロビジョニング後に実行するスクリプトを指定できます。gcloud コマンドを使用する場合、--metadata フラグまたは --metadata-from-file フラグのいずれかを使用して、それぞれスクリプト コマンド、スクリプト コードを記述したファイルを指定できます。curl を使用する場合は、JSON コンテンツにスクリプト コードを記述する必要があります。次の例では、startup-script.sh に記述されたスクリプトを実行する、キューに格納されたリソース リクエストを作成します。curl の例は、JSON 本文のインライン スクリプトを示しています。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.12.0 \
  --metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.17.0-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンドフラグの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
リクエストに応答して作成された TPU のユーザー定義 ID。
project
キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
validInterval
リクエストがキャンセルされた後、リクエストが有効な期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
metadata-from-file
メタデータを含むファイルを指定します。メタデータ ファイルの完全修飾パスを指定しない場合、コマンドはメタデータ ファイルが現在のディレクトリにあると想定します。この例では、キュー内のリソースがプロビジョニングされるときに実行される起動スクリプトがファイルに含まれています。
metadata
リクエストのメタデータを指定します。この例では、メタデータは、キュー内のリソースがプロビジョニングされるときに実行される起動スクリプト コマンドです。

指定したネットワークとサブネットワークでキューに格納されたリソースをリクエストする

TPU を接続するネットワークとサブネットワークを指定して、キューに格納されたリソースをリクエストできます。

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --network network-name \
  --subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

コマンド パラメータの説明

queued-resource-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
Google Cloud プロジェクト
zone
Cloud TPU を作成するゾーン
accelerator-type
アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
Cloud TPU ソフトウェアのバージョン。
reserved
このフラグは、Cloud TPU 予約の一部としてキュー内のリソースをリクエストするときに使用します。
network
キューに格納されたリソースが属するネットワーク。
subnetwork
キューに格納されたリソースが属するサブネットワーク。

キューに入れられたリソース リクエストを削除する

キューに入れられたリソース リクエストとそのリクエストによって作成された TPU VM を削除するには、--force フラグを queued-resource delete コマンドに渡します。それ以外の場合は、キューに入れられたリソース リクエストを削除する前に、TPU VM を削除する必要があります。TPU VM を削除すると、キューに入れられたリソース リクエストは SUSPENDED 状態に移行し、その後、キューに入れられたリソース リクエストが削除される可能性があります。

次のコマンドは、ゾーン「us-central2-b」の「my-project」プロジェクト内の「my-queued-resource」という名前のキューに入れられたリソース リクエストを削除します。--force フラグを使用して、TPU VM とキューに入れられたリソース リクエストの両方を削除します。

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
  --project my-project \
  --zone us-central2-b \
  --force \
  --async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

コマンドフラグの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
project
キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
削除する Cloud TPU のゾーン
force
TPU VM とキューに入れられたリソース リクエストの両方を削除します。

次のコマンドは、ゾーン「us-central2-b」の「my-project」プロジェクト内の「my-queued-resource」という名前のキューに入れられたリソース リクエストを削除します。

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
  --project your-project-id \
  --zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

コマンドフラグの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
project
キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
Cloud TPU を作成するゾーン

キューに入れられたリソース リクエストの状態と診断情報を取得する

キューに入れられたリソース リクエストの状態と診断情報を取得します。

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
  --project your-project-id \
  --zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

コマンドフラグの説明

queued-resource-request-id
キューに入れられたリソース リクエストのユーザー割り当て ID。
project
キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
Cloud TPU を作成するゾーン

リクエストが失敗した場合、レスポンスにはエラー情報が含まれます。リソースを待機しているリクエストの場合、出力は次のようになります。

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

プロジェクト内のキューに入れられたリソース リクエストを一覧表示する

次のコマンドは、プロジェクト「your-project-id」のキューに入れられたリソース リクエストを一覧表示します。

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
  --zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

コマンドフラグの説明

project
キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
Cloud TPU を作成するゾーン