キューに格納されたリソースのユーザーガイド
キューに格納されたリソースを使用すると、Cloud TPU リソースをキューに格納してリクエストできます。キューに格納されたリソースをリクエストすると、リクエストは Cloud TPU サービスによって管理されるキューに追加されます。リクエストされたリソースが使用可能になると、すぐに Google Cloud プロジェクトに割り当てられ、すぐに専用で使用できるようになります。プロジェクトを削除またはプリエンプトしない限り、プロジェクトに割り当てられたままになります。プリエンプションの対象は TPU Spot VM とプリエンプティブル TPU のみとなります。
キューに入れられたリソース リクエストで、開始時刻や終了時刻(オプション)を指定できます。開始時刻は、リクエストを満たす最も早い時間を指定します。リクエストが指定された終了時刻まで処理されなかった場合、リクエストは期限切れになります。リクエストは、期限が切れた後もキューに残ります。
キューに格納されたリソース リクエストは、次のいずれかの状態になります。
WAITING_FOR_RESOURCES
- リクエストは最初の検証に合格し、キューに追加されています。 この状態は、リクエストのプロビジョニングを開始するのに十分な空きリソースがあるか、割り当て区間が経過するまで維持されます。需要が高い場合、すべてのリクエストを直ちにプロビジョニングできるわけではありません。TPU の信頼性を高める必要がある場合は、予約の購入を検討してください。
PROVISIONING
- キューからリクエストが選択され、そのリソースは現在割り当てられています。
ACTIVE
- リクエストが割り当てられました。キューに格納されたリソース リクエストが
ACTIVE
状態になると、TPU を管理するの説明に従って TPU VM を管理できます。 FAILED
- リクエストに問題があるか、リクエストされたリソースが割り当て区間内で使用できないため、リクエストを完了できませんでした。リクエストは、明示的に削除されるまでキューに残ります。
SUSPENDING
- リクエストに関連付けられているリソースが現在削除されています。
SUSPENDED
- リクエストで指定されたリソースが削除されました。リクエストが
SUSPENDED
状態になると、それ以上の割り当てはできなくなります。
前提条件
このガイドのコマンドを実行する前に、次のことを確認してください。
- Google Cloud CLI アルファ版コンポーネントをインストールする
- Cloud TPU API を有効にする
キューに入れられたオンデマンド リソースをリクエストする
gcloud compute tpus queued-resources create
コマンドを使用して、オンデマンド キューに格納されたリソースをリクエストできます。オンデマンド リソースの詳細については、割り当てタイプをご覧ください。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
- Google Cloud プロジェクト
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。各 TPU のバージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
キューに格納されたオンデマンド リソースのデフォルトのスライスサイズ
オンデマンド割り当てを使用する場合、使用しているアクセラレータ タイプのデフォルトの上限よりも小さいスライス サイズをリクエストする必要があります。デフォルトの上限を超えるリクエストは、システムによって拒否されます。
次の表に、TPU タイプごとのデフォルトの上限を示します。
アクセラレータ タイプ | デフォルトの上限(TensorCore の数) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
より大きなスライスサイズが必要な場合は、Cloud TPU のサポートにお問い合わせください。
予約済みの割り当てを使用して、キューに格納されたリソースをリクエストする
予約済みの割り当てを使用して、キューに格納されたリソースをリクエストするには、gcloud
コマンドで --reserved
フラグを指定するか、curl リクエストで guaranteed.reserved=true
を指定します。予約済みの割り当ての詳細については、割り当てタイプをご覧ください。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
- Google Cloud プロジェクト
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。各 TPU のバージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
reserved
- このフラグは、Cloud TPU 予約の一部としてキュー内のリソースをリクエストするときに使用します。
キューに入れられた TPU Spot VM のリソースをリクエストする
Spot VM は、いつでもプリエンプトして別のワークロードに割り当てることができるリソースです。Spot VM のリソースは低コストで、Spot VM 以外のリクエストよりも早くリソースにアクセスできる場合があります。TPU Spot VM の詳細については、TPU Spot VM を管理するをご覧ください。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストへのレスポンスとして作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
spot
- キューに入れられたリソースが Spot VM であることを指定するブール値のフラグ。
指定した時間の前後にキューに入れられたリソースを割り当てるようリクエストする
(省略可)開始時刻、終了時刻、開始時間、または終了時間。開始時間または開始時間は、リクエストを満たす最も早い時間を指定します。リクエストが、指定された終了時間または指定時間内に完了しなかった場合、リクエストは期限切れになります。リクエストが期限切れになると、キューには残りますが、割り当てはできなくなります。
開始時間または終了時間と終了時間(または期間)を指定することで割り当て間隔を指定することもできます。
サポートされているタイムスタンプと期間の形式のリストについては、日時をご覧ください。
指定した時間内にキューに格納されたリソースをリクエストする
--valid-after-duration
フラグを使用して、リソースを割り当てるまでの時間を指定できます。次の例では、v4-32 を 6 時間後に割り当てるようリクエストします。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストへのレスポンスとして作成された TPU のユーザー定義 ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-after-duration
- TPU をプロビジョニングしてはならない期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
指定した期間の経過後に期限切れとなるキューに格納されたリソースをリクエストする
キューに入れられたリソース リクエストの有効期間は、--valid-until-duration
フラグを使用して指定できます。次の例では、6 時間の内に入力しないと期限切れになる v4-32 をリクエストします。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストへのレスポンスとして作成された TPU のユーザー定義 ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-until-duration
- リクエストが有効である期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
指定した時間の経過後にキューに格納されたリソースをリクエストする
--valid-after-time
フラグを使用して、リソースを割り当てる時間を指定できます。
次のコマンドは、ランタイム バージョン tpu-vm-tf-2.16.1-pjrt
の v4-4096 TPU を 2022 年 12 月 14 日午前 9 時以降に割り当てるようリクエストします。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストへのレスポンスとして作成された TPU のユーザー定義 ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-after-time
- リソースが割り当てられるべき時間。期間の形式の詳細については、Google Cloud CLI topic datetime をご覧ください。
指定した時間が経過するまでにキューに格納されたリソースをリクエストする
--valid-until-time
フラグを使用して、リソースを割り当てるまでの時間を指定できます。
次のコマンドは、ランタイム バージョン tpu-vm-tf-2.10.0-pod
の v4-4096 TPU ノードを、2022 年 12 月 14 日午前 9 時までに作成するようリクエストします。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストへのレスポンスとして作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-until-time
- それ以降はリクエストがキャンセルされる時間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
キューに格納されたリソースを指定された時間内に割り当てるようリクエストする
--valid-after-time
、--valid-after-duration
、--valid-until-duration
、--valid-until-time
フラグのうち、1 つが割り当て区間の開始を、もう 1 つが割り当て区間の終了を指定するものであれば、任意の組を使って割り当て区間を指定することができます。
次のコマンドは、現在の時刻から 5 時間 30 分後で、2022 年 12 月 14 日午前 9 時までに v4-32 を作成するようリクエストします。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストへのレスポンスとして作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
valid-until-timw
- それ以降はリクエストがキャンセルされる時間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
valid-until-duration
- リクエストが有効である期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
起動スクリプトでキューに格納されたリソースをリクエストする
キューに格納されたリソースに対してプロビジョニング後に実行するスクリプトを指定できます。gcloud
コマンドを使用する場合、--metadata
フラグまたは --metadata-from-file
フラグのいずれかを使用して、それぞれスクリプト コマンド、スクリプト コードを記述したファイルを指定できます。curl
を使用する場合は、JSON コンテンツにスクリプト コードを記述する必要があります。次の例では、startup-script.sh
に記述されたスクリプトを実行する、キューに格納されたリソース リクエストを作成します。curl
の例は、JSON 本文のインライン スクリプトを示しています。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.16.1-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- リクエストへのレスポンスとして作成された TPU のユーザー定義 ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。TPU のバージョンごとにサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
validInterval
- リクエストがキャンセルされた後、リクエストが有効な期間。期間形式の詳細については、Google Cloud CLI トピックの日時をご覧ください。
metadata-from-file
- メタデータを含むファイルを指定します。メタデータ ファイルへの完全修飾パスを指定しない場合、このコマンドは現在のディレクトリにあるものと想定します。この例では、キュー内のリソースがプロビジョニングされるときに実行される起動スクリプトがファイルに含まれています。
metadata
- リクエストのメタデータを指定します。この例では、メタデータは、キューに格納されたリソースがプロビジョニングされたときに実行される起動スクリプト コマンドです。
指定したネットワークとサブネットワークでキューに格納されたリソースをリクエストする
TPU を接続するネットワークとサブネットワークを指定して、キューに格納されたリソースをリクエストできます。
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
コマンド パラメータの説明
queued-resource-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
node-id
- キューに入れられたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID。
project
- Google Cloud プロジェクト
zone
- Cloud TPU を作成するゾーン。
accelerator-type
- アクセラレータ タイプでは、作成する Cloud TPU のバージョンとサイズを指定します。各 TPU のバージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
runtime-version
- Cloud TPU ソフトウェアのバージョン。
reserved
- このフラグは、Cloud TPU 予約の一部としてキュー内のリソースをリクエストするときに使用します。
network
- キューに入れられたリソースが属するネットワーク。
subnetwork
- キューに格納されたリソースが属するサブネットワーク。
キューに入れられたリソース リクエストを削除する
キューに入れられたリソース リクエストとそのリクエストによって作成された TPU VM を削除するには、--force
フラグを queued-resource delete
コマンドに渡します。それ以外の場合は、キューに入れられたリソース リクエストを削除する前に、TPU VM を削除する必要があります。TPU VM を削除すると、キューに入れられたリソース リクエストは SUSPENDED
状態に移行し、その後、キューに入れられたリソース リクエストが削除される可能性があります。
次のコマンドは、ゾーン「us-central2-b」の「my-project」プロジェクト内の「my-queued-resource」という名前のキューに入れられたリソース リクエストを削除します。--force
フラグを使用して、TPU VM とキューに入れられたリソース リクエストの両方を削除します。
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- 削除する Cloud TPU のゾーン。
force
- TPU VM とキューに入れられたリソース リクエストの両方を削除します。
次のコマンドは、ゾーン「us-central2-b」の「my-project」プロジェクト内の「my-queued-resource」という名前のキューに入れられたリソース リクエストを削除します。
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。
キューに入れられたリソース リクエストの状態と診断情報を取得する
キューに入れられたリソース リクエストの状態と診断情報を取得します。
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
コマンドフラグの説明
queued-resource-request-id
- キューに入れられたリソース リクエストのユーザー割り当て ID。
project
- キューに格納されたリソースが割り当てられているプロジェクトの ID。
zone
- Cloud TPU を作成するゾーン。
リクエストが失敗した場合、レスポンスにはエラー情報が含まれます。リソースを待機しているリクエストの場合、出力は次のようになります。
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
プロジェクト内のキューに入れられたリソース リクエストを一覧表示する
次のコマンドは、プロジェクト「your-project-id」のキューに入れられたリソース リクエストを一覧表示します。
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
コマンドフラグの説明
project
- キューに入れられたリソースが割り当てられている Google Cloud プロジェクト。
zone
- Cloud TPU を作成するゾーン。