キューに格納されたリソースのユーザーガイド
キューに格納されたリソースを使用すると、Cloud TPU リソースをキューに格納してリクエストできます。キューに格納されたリソースをリクエストすると、リクエストは Cloud TPU サービスによって管理されるキューに追加されます。リクエストされたリソースが使用可能になると、すぐに Google Cloud プロジェクトに割り当てられ、すぐに専用で使用できるようになります。プロジェクトを削除またはプリエンプトしない限り、プロジェクトに割り当てられたままになります。プリエンプションの対象は TPU Spot VM とプリエンプティブル TPU のみとなります。
キューに入れられたリソース リクエストで、開始時刻や終了時刻(オプション)を指定できます。開始時刻は、リクエストを入力できる最も早い時刻を指定します。指定された終了時刻までにリクエストが入力されていない場合、リクエストは期限切れになります。リクエストは有効期限が切れた後もキュー内に残ります。
キューに格納されたリソース リクエストは、次のいずれかの状態になります。
WAITING_FOR_RESOURCES
- リクエストは最初の検証に合格し、キューに追加されました。この状態は、リクエストのプロビジョニングを開始するのに十分な空きリソースがあるか、割り当て区間が経過するまで維持されます。需要が高い場合、すべてのリクエストをすぐにプロビジョニングできるわけではありません。TPU の信頼性を高める必要がある場合は、予約の購入を検討してください。
PROVISIONING
- リクエストがキューから選択され、リソースが割り当てられています。
ACTIVE
- リクエストが割り当てられました。キューに格納されたリソース リクエストが
ACTIVE
状態になると、TPU を管理するの説明に従って TPU VM を管理できます。 FAILED
- リクエストに問題があるか、リクエストされたリソースが割り当て区間内で使用できないため、リクエストを完了できませんでした。リクエストは、明示的に削除されるまでキューに残ります。
SUSPENDING
- リクエストに関連付けられているリソースが削除されています。
SUSPENDED
- リクエストで指定されたリソースが削除されました。リクエストが
SUSPENDED
状態になると、それ以上の割り当ての対象外になります。
前提条件
このガイドのコマンドを実行する前に、次のことを行ってください。
- Google Cloud CLI アルファ版コンポーネントをインストールする
- Cloud TPU API を有効にする
キューに入れられたオンデマンド リソースをリクエストする
キューに入れられたオンデマンド リソースをリクエストするには、gcloud compute tpus queued-resources create
コマンドを使用します。オンデマンド リソースの詳細については、割り当てタイプをご覧ください。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
- Google Cloud プロジェクト
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
キューに格納されたオンデマンド リソースのデフォルトのスライスサイズ
オンデマンド割り当てを使用する場合は、使用しているアクセラレータ タイプのデフォルトの上限よりも小さいスライスサイズをリクエストする必要があります。デフォルトの上限を超えるリクエストは、システムによって拒否されます。
次の表に、TPU タイプごとのデフォルトの上限を示します。
アクセラレータ タイプ | デフォルトの上限(TensorCore の数) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
より大きなスライスサイズが必要な場合は、Cloud TPU サポートに詳細をお問い合わせください。
予約を使用してキューに格納されたリソースをリクエストする
予約を使用して、キューに格納されたリソースをリクエストするには、gcloud
コマンドで --reserved
フラグを指定するか、curl リクエストで guaranteed.reserved=true
を指定します。予約を購入するには、Google Cloud アカウント チームにお問い合わせください。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
- Google Cloud プロジェクト
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
reserved
- このフラグは、Cloud TPU 予約の一部としてキュー内のリソースをリクエストするときに使用します。
キューに入れられた TPU Spot VM のリソースをリクエストする
Spot VM は、いつでもプリエンプトして別のワークロードに割り当てることができるリソースです。Spot VM のリソースは低コストで、Spot VM 以外のリクエストよりも早くリソースにアクセスできる場合があります。TPU Spot VM の詳細については、TPU Spot VM を管理するをご覧ください。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストに応答して作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
spot
- キューに入れられたリソースが Spot VM であることを指定するブール値のフラグ。
指定した時間の前後にキューに入れられたリソースを割り当てるようリクエストする
キューに入れられたリソース リクエストで、必要に応じて開始時刻、終了時刻、開始時間、終了時間を指定できます。開始時刻または開始時間は、リクエストを入力する最も早い時刻を指定します。指定した終了時刻までに、または指定した期間内にリクエストが入力されていない場合、リクエストは期限切れになります。リクエストの有効期限が切れると、キューには残りますが、割り当ての対象外になります。
開始時刻または期間と終了時刻または期間を指定して、割り当て間隔を指定することもできます。
サポートされているタイムスタンプと期間の形式の一覧については、日時をご覧ください。
指定した時間内にキューに格納されたリソースをリクエストする
--valid-after-duration
フラグを使用して、経過後にリソースを割り当てる期間を指定できます。次の例では、v4-32 を 6 時間後に割り当てるようリクエストします。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストに応答して作成された TPU のユーザー定義 ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-after-duration
- 経過するまでの間 TPU をプロビジョニングできない期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
指定した期間の経過後に期限切れとなるキューに格納されたリソースをリクエストする
キューに入れられたリソース リクエストの有効期間は、--valid-until-duration
フラグを使用して指定できます。次の例では、6 時間の内に入力しないと期限切れになる v4-32 をリクエストします。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストに応答して作成された TPU のユーザー定義 ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-until-duration
- リクエストが有効である期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
指定した時間の経過後にキューに格納されたリソースをリクエストする
--valid-after-time
フラグを使用して、リソースを割り当てる時間を指定できます。
次のコマンドは、ランタイム バージョン tpu-vm-tf-2.17.0-pjrt
の v4-4096 TPU を 2022 年 12 月 14 日午前 9 時以降に割り当てるようリクエストします。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストに応答して作成された TPU のユーザー定義 ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-after-time
- リソースが割り当てられるべき時間。期間の形式の詳細については、Google Cloud CLI topic datetime をご覧ください。
指定した時間が経過するまでにキューに格納されたリソースをリクエストする
--valid-until-time
フラグを使用して、リソースの割り当てを行う必要がある期限に該当する時刻を指定できます。
次のコマンドは、ランタイム バージョン tpu-vm-tf-2.10.0-pod
の v4-4096 TPU を、2022 年 12 月 14 日午前 9 時までに作成するようリクエストします。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストに応答して作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-until-time
- それ以降はリクエストがキャンセルされる時間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
キューに格納されたリソースを指定された時間内に割り当てるようリクエストする
--valid-after-time
、--valid-after-duration
、--valid-until-duration
、--valid-until-time
フラグのうち、1 つが割り当て区間の開始を、もう 1 つが割り当て区間の終了を指定するものであれば、任意の組を使って割り当て区間を指定することができます。
次のコマンドは、現在の時刻から 5 時間 30 分後で、2022 年 12 月 14 日午前 9 時までに v4-32 を作成するようリクエストします。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストに応答して作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-until-timw
- それ以降はリクエストがキャンセルされる時間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
valid-until-duration
- リクエストが有効である期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
起動スクリプトでキューに格納されたリソースをリクエストする
キューに格納されたリソースに対してプロビジョニング後に実行するスクリプトを指定できます。gcloud
コマンドを使用する場合、--metadata
フラグまたは --metadata-from-file
フラグのいずれかを使用して、それぞれスクリプト コマンド、スクリプト コードを記述したファイルを指定できます。curl
を使用する場合は、JSON コンテンツにスクリプト コードを記述する必要があります。次の例では、startup-script.sh
に記述されたスクリプトを実行する、キューに格納されたリソース リクエストを作成します。curl
の例は、JSON 本文のインライン スクリプトを示しています。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.17.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストに応答して作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
validInterval
- リクエストがキャンセルされた後、リクエストが有効な期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
metadata-from-file
- メタデータを含むファイルを指定します。メタデータ ファイルの完全修飾パスを指定しない場合、コマンドはメタデータ ファイルが現在のディレクトリにあると想定します。この例では、キュー内のリソースがプロビジョニングされるときに実行される起動スクリプトがファイルに含まれています。
metadata
- リクエストのメタデータを指定します。この例では、メタデータは、キュー内のリソースがプロビジョニングされるときに実行される起動スクリプト コマンドです。
指定したネットワークとサブネットワークでキューに格納されたリソースをリクエストする
TPU を接続するネットワークとサブネットワークを指定して、キューに格納されたリソースをリクエストできます。
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
- Google Cloud プロジェクト
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
reserved
- このフラグは、Cloud TPU 予約の一部としてキュー内のリソースをリクエストするときに使用します。
network
- キューに格納されたリソースが属するネットワーク。
subnetwork
- キューに格納されたリソースが属するサブネットワーク。
キューに入れられたリソース リクエストを削除する
キューに入れられたリソース リクエストとそのリクエストによって作成された TPU VM を削除するには、--force
フラグを queued-resource delete
コマンドに渡します。それ以外の場合は、キューに入れられたリソース リクエストを削除する前に、TPU VM を削除する必要があります。TPU VM を削除すると、キューに入れられたリソース リクエストは SUSPENDED
状態に移行し、その後、キューに入れられたリソース リクエストが削除される可能性があります。
次のコマンドは、ゾーン「us-central2-b」の「my-project」プロジェクト内の「my-queued-resource」という名前のキューに入れられたリソース リクエストを削除します。--force
フラグを使用して、TPU VM とキューに入れられたリソース リクエストの両方を削除します。
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- 削除する Cloud TPU のゾーン。
force
- TPU VM とキューに入れられたリソース リクエストの両方を削除します。
次のコマンドは、ゾーン「us-central2-b」の「my-project」プロジェクト内の「my-queued-resource」という名前のキューに入れられたリソース リクエストを削除します。
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
キューに入れられたリソース リクエストの状態と診断情報を取得する
キューに入れられたリソース リクエストの状態と診断情報を取得します。
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
リクエストが失敗した場合、レスポンスにはエラー情報が含まれます。リソースを待機しているリクエストの場合、出力は次のようになります。
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
プロジェクト内のキューに入れられたリソース リクエストを一覧表示する
次のコマンドは、プロジェクト「your-project-id」のキューに入れられたリソース リクエストを一覧表示します。
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
コマンドフラグの説明
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。