Nutzerhandbuch für Ressourcen in der Warteschlange
Mit Ressourcen in der Warteschlange können Sie Cloud TPU-Ressourcen in der Warteschlange anfordern. Wenn Sie Ressourcen in der Warteschlange anfordern, wird die Anfrage einer vom Cloud TPU-Dienst verwalteten Warteschlange hinzugefügt. Wenn die angeforderte Ressource verfügbar ist, wird sie Ihrem Google Cloud-Projekt zur sofortigen ausschließlichen Verwendung zugewiesen. Es bleibt Ihrem Projekt zugewiesen, bis Sie es löschen oder es vorzeitig beendet wird. Nur TPU-Spot-VMs und TPUs auf Abruf können vorzeitig beendet werden.
Sie können in einer Ressourcenanfrage, die in die Warteschlange gestellt wurde, eine optionale Start- und Endzeit angeben. Die Startzeit gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wenn eine Anfrage nicht bis zum angegebenen Ende ausgeführt wurde, läuft sie ab. Die Anfrage bleibt in der Warteschlange, nachdem sie abgelaufen ist.
Ressourcenanfragen in der Warteschlange können einen der folgenden Status haben:
WAITING_FOR_RESOURCES
- Die Anfrage hat die erste Validierung bestanden und wurde der Warteschlange hinzugefügt. Der Status bleibt in diesem Zustand, bis genügend freie Ressourcen vorhanden sind, um mit der Bereitstellung der Anfrage zu beginnen, oder das Zuweisungsintervall abgelaufen ist. Bei hoher Nachfrage können nicht alle Anfragen sofort bereitgestellt werden. Wenn Sie eine zuverlässigere Erreichbarkeit von TPUs benötigen, sollten Sie den Kauf einer Reservierung in Betracht ziehen.
PROVISIONING
- Die Anfrage wurde aus der Warteschlange ausgewählt und ihre Ressourcen werden gerade zugewiesen.
ACTIVE
- Die Anfrage wurde zugewiesen. Wenn Ressourcenanfragen in der Warteschlange den Status
ACTIVE
haben, können Sie Ihre TPU-VMs wie unter TPUs verwalten beschrieben verwalten. FAILED
- Die Anfrage konnte nicht abgeschlossen werden, da entweder ein Problem mit der Anfrage vorliegt oder die angeforderten Ressourcen innerhalb des Zuweisungsintervalls nicht verfügbar waren. Die Anfrage bleibt in der Warteschlange, bis sie explizit gelöscht wird.
SUSPENDING
- Die mit der Anfrage verknüpften Ressourcen werden gerade gelöscht.
SUSPENDED
- Die in der Anfrage angegebenen Ressourcen wurden gelöscht. Wenn eine Anfrage den Status
SUSPENDED
hat, kann sie nicht mehr zugewiesen werden.
Vorbereitung
Bevor Sie die Befehle in dieser Anleitung ausführen, führen Sie folgende Schritte aus:
- Installieren Sie die Alphakomponenten der Google Cloud CLI.
- Cloud TPU API aktivieren
On-Demand-Ressource in der Warteschlange anfordern
Mit dem Befehl gcloud compute tpus queued-resources create
können Sie eine On-Demand-Ressource in der Warteschlange anfordern. Weitere Informationen zu On-Demand-Ressourcen finden Sie unter Kontingenttypen.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die bei der Zuweisung der Ressourcenanfrage in der Warteschlange erstellt wird.
project
- Ihr Google Cloud-Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
Standardsegmentgrößen für On-Demand-Ressourcen in der Warteschlange
Wenn Sie ein On-Demand-Kontingent verwenden, müssen Sie eine Segmentgröße anfordern, die kleiner als das Standardlimit für den verwendeten Beschleunigertyp ist. Anfragen, die die Standardlimits überschreiten, werden vom System abgelehnt.
Die folgende Tabelle zeigt die TPU-Typen und die zugehörigen Standardlimits.
Beschleunigertyp | Standardlimit (in der Anzahl von TensorCores) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Wenn Sie größere Slice-Größen benötigen, wenden Sie sich an den Cloud TPU-Support, um weitere Informationen zu erhalten.
Ressource in der Warteschlange mit reserviertem Kontingent anfordern
Sie können eine Ressource in der Warteschlange mit einem reservierten Kontingent anfordern. Geben Sie dazu das Flag --reserved
im Befehl gcloud
oder guaranteed.reserved=true
in Ihrer curl-Anfrage an. Weitere Informationen zu reservierten Kontingenten finden Sie unter Kontingenttypen.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die bei der Zuweisung der Ressourcenanfrage in der Warteschlange erstellt wird.
project
- Ihr Google Cloud-Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
reserved
- Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.
TPU-Spot-VM-Ressource anfordern, die sich in der Warteschlange befindet
Eine Spot-VM ist eine Ressource, die jederzeit vorzeitig beendet und einer anderen Arbeitslast zugewiesen werden kann. Spot-VM-Ressourcen kosten weniger und Sie erhalten möglicherweise früher Zugriff auf Ressourcen als eine Nicht-Spot-VM-Anfrage. Weitere Informationen zu TPU-Spot-VMs finden Sie unter TPU-Spot-VMs verwalten.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
spot
- Ein boolesches Flag, das angibt, dass die Ressource in der Warteschlange eine Spot-VM ist.
Fordern Sie die Zuweisung einer Ressource in der Warteschlange vor oder nach einer bestimmten Zeit an
Sie können in einer Ressourcenanfrage in der Warteschlange optional eine Startzeit, Endzeit, Startdauer oder Enddauer angeben. Die Startzeit oder Startdauer gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wurde eine Anfrage zur angegebenen Endzeit oder innerhalb der angegebenen Dauer nicht ausgeführt, läuft sie ab. Nachdem die Anfrage abgelaufen ist, bleibt sie in der Warteschlange, kann jedoch nicht mehr zugewiesen werden.
Sie können auch ein Zuordnungsintervall festlegen, indem Sie eine Startzeit oder Dauer und eine Endzeit oder Dauer angeben.
Eine Liste der unterstützten Formate für Zeitstempel und Dauer finden Sie unter Datum/Uhrzeit.
Ressource in der Warteschlange nach einer bestimmten Dauer anfordern
Mit dem Flag --valid-after-duration
können Sie eine Dauer angeben, nach der eine Ressource zugewiesen werden soll. Im folgenden Beispiel wird die Zuweisung einer v4-32-Version nach sechs Stunden angefordert.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
valid-after-duration
- Der Zeitraum, innerhalb dessen die TPU nicht bereitgestellt werden darf. Weitere Informationen zu Formaten für die Dauer finden Sie unter Google Cloud CLI-Thema – Datum und Uhrzeit
Ressource in der Warteschlange anfordern, die nach einer bestimmten Dauer abläuft
Mit dem Flag --valid-until-duration
können Sie angeben, wie lange eine Ressourcenanfrage in der Warteschlange gültig bleibt. Im folgenden Beispiel wird eine Version 4-32 angefordert, die abläuft, wenn sie nicht innerhalb von sechs Stunden ausgefüllt wird.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Formaten für die Dauer finden Sie unter Google Cloud CLI-Thema – Datum und Uhrzeit
Ressource in der Warteschlange nach einer bestimmten Zeit anfordern
Mit dem Flag --valid-after-time
können Sie eine Zeit angeben, nach der eine Ressource zugewiesen werden soll.
Mit dem folgenden Befehl wird eine v4-4096-TPU mit der Laufzeitversion tpu-vm-tf-2.16.1-pjrt
angefordert, die nach 9:00 Uhr am 14. Dezember 2022 zugewiesen wird.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
valid-after-time
- Die Zeit, nach der die Ressource zugewiesen werden soll. Weitere Informationen zu Dauerformaten finden Sie unter Google Cloud CLI topic datetime.
Ressource in der Warteschlange vor einem bestimmten Zeitpunkt anfordern
Mit dem Flag --valid-until-time
können Sie einen Zeitpunkt angeben, vor dem die Ressource zugewiesen werden soll.
Mit dem folgenden Befehl wird ein v4-4096-TPU-Knoten mit der Laufzeitversion tpu-vm-tf-2.10.0-pod
angefordert, der spätestens am 14. Dezember 2022 um 09:00 Uhr erstellt werden muss.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
valid-until-time
- Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.
Fordern Sie eine Ressource in der Warteschlange an, die innerhalb eines bestimmten Intervalls zugewiesen wird
Sie können ein Zuweisungsintervall mit einem beliebigen Paar der Flags --valid-after-time
, --valid-after-duration
, --valid-until-duration
und --valid-until-time
angeben, sofern ein Flag den Beginn des Zuweisungsintervalls und das andere das Ende des Zuweisungsintervalls angibt.
Mit dem folgenden Befehl wird in 5 Stunden und 30 Minuten ab der aktuellen Uhrzeit eine Version 4-32 angefordert, die spätestens am 14. Dezember 2022 um 9:00 Uhr erstellt wird.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.16.1-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
valid-until-timw
- Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.
Ressource in der Warteschlange mit einem Startskript anfordern
Sie können ein Skript angeben, das auf einer Ressource in der Warteschlange ausgeführt werden soll, nachdem diese bereitgestellt wurde. Bei Verwendung des Befehls gcloud
können Sie entweder das Flag --metadata
oder --metadata-from-file
verwenden, um einen Skriptbefehl oder eine Datei mit dem Skriptcode anzugeben. Wenn Sie curl
verwenden, müssen Sie den Skriptcode in den JSON-Inhalt einfügen. Im folgenden Beispiel wird eine Ressourcenanfrage in der Warteschlange erstellt, durch die das in startup-script.sh
enthaltene Skript ausgeführt wird. Das Beispiel curl
zeigt ein Inline-Skript im JSON-Text.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.16.1-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
validInterval
- Der Zeitraum, in dem die Anfrage gültig ist und nach dem sie abgebrochen wird. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.
metadata-from-file
- Gibt eine Datei an, die Metadaten enthält. Wenn Sie keinen voll qualifizierten Pfad zur Metadatendatei angeben, wird im Befehl davon ausgegangen, dass sie sich im aktuellen Verzeichnis befindet. In diesem Beispiel enthält die Datei ein Startskript, das bei Bereitstellung der Ressource in der Warteschlange ausgeführt wird.
metadata
- Gibt die Metadaten für die Anfrage an. In diesem Beispiel sind die Metadaten ein Startskriptbefehl, der ausgeführt wird, wenn die Ressource in der Warteschlange bereitgestellt wird.
Ressourcen in der Warteschlange mit einem angegebenen Netzwerk und Subnetzwerk anfordern
Sie können eine Ressource in der Warteschlange anfordern und dabei das Netzwerk und das Subnetzwerk angeben, mit dem Sie die TPU verbinden möchten.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.16.1-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.16.1-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die bei der Zuweisung der Ressourcenanfrage in der Warteschlange erstellt wird.
project
- Ihr Google Cloud-Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Cloud TPU-Softwareversion.
reserved
- Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.
network
- Ein Netzwerk, zu dem die Ressource in der Warteschlange gehört.
subnetwork
- Ein Subnetzwerk, zu dem die Ressource in der Warteschlange gehört.
Ressourcenanfrage in der Warteschlange löschen
Sie können eine Ressourcenanfrage in der Warteschlange und die dadurch erstellte TPU-VM löschen. Dazu übergeben Sie das Flag --force
an den Befehl queued-resource delete
. Andernfalls müssen Sie die TPU-VM löschen, bevor Sie die Ressourcenanfrage in der Warteschlange löschen. Wenn Sie die TPU-VM löschen, geht die Ressourcenanfrage in der Warteschlange in den Status SUSPENDED
über. Danach wird die Ressourcenanfrage in der Warteschlange möglicherweise gelöscht.
Mit den folgenden Befehlen wird die Ressourcenanfrage „my-queued-resource“ in der Warteschlange im Projekt „my-project“ in der Zone „us-central2-b“ gelöscht. Das Flag --force
wird verwendet, um sowohl die TPU-VM als auch die Ressourcenanfrage in der Warteschlange zu löschen.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
- Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen ist.
zone
- Die Zone der Cloud TPU, die gelöscht werden soll.
force
- Löschen Sie sowohl die TPU-VM als auch die Ressourcenanfrage in der Warteschlange.
Mit den folgenden Befehlen wird die Ressourcenanfrage „my-queued-resource“ in der Warteschlange im Projekt „my-project“ in der Zone „us-central2-b“ gelöscht.
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
- Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
Status- und Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange abrufen
Rufen Sie den Status und die Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange ab:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
- Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
Wenn die Anfrage fehlschlägt, enthält die Antwort Fehlerinformationen. Für eine Anfrage, die auf Ressourcen wartet, sieht die Ausgabe in etwa so aus:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Ressourcenanfragen in der Warteschlange im Projekt auflisten
Der folgende Befehl listet die Ressourcenanfragen in der Warteschlange im Projekt "your-project-id" auf:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Beschreibung der Befehls-Flags
project
- Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.