Nutzerhandbuch für Ressourcen in der Warteschlange
Mit Ressourcen in der Warteschlange können Sie Cloud TPU-Ressourcen in einer Warteschlange anfordern. Wenn Sie Ressourcen in der Warteschlange anfordern, wird die Anfrage einer Warteschlange hinzugefügt, die vom Cloud TPU-Dienst verwaltet wird. Wenn die angeforderte Ressource verfügbar ist, wird sie Ihrem Google Cloud-Projekt zur sofortigen exklusiven Nutzung zugewiesen. Er bleibt so lange Ihrem Projekt zugewiesen, bis Sie ihn löschen oder präemptiv beendet werden. Nur präemptive TPUs können vorzeitig beendet werden.
Sie können in einer Ressourcenanfrage in der Warteschlange eine optionale Startzeit und/oder eine Endzeit angeben. Die Startzeit gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wenn eine Anfrage nicht bis zum angegebenen Ende ausgeführt wurde, läuft sie ab. Die Anfrage bleibt in der Warteschlange, nachdem sie abgelaufen ist.
Anfragen von Ressourcen in der Warteschlange können einen der folgenden Status haben:
ACCEPTED
- Die Anfrage wurde der Warteschlange hinzugefügt.
ACTIVE
- Die Anfrage wurde zugewiesen.
FAILED
- Die Anfrage konnte nicht abgeschlossen werden.
SUSPENDED
- Die in der Anfrage angegebenen Ressourcen wurden gelöscht.
Wenn eine Ressourcenanfrage in der Warteschlange der Warteschlange hinzugefügt wird, wird ihr Status auf ACCEPTED
gesetzt. Er bleibt in diesem Zustand, bis er zugewiesen wird oder sein Zuweisungsintervall abläuft.
Wenn die Anfrage zugewiesen ist, wird ihr Status auf ACTIVE
gesetzt. Wenn ein Zuweisungsintervall einer Anfrage abläuft, bleibt sein Status im Status ACCEPTED
, kann aber nicht mehr zugewiesen werden. Anfragen in der Warteschlange bleiben so lange in der Warteschlange, bis sie explizit gelöscht werden.
Wenn die in einer Anfrage angegebenen Ressourcen gelöscht werden, wechselt die Anfrage in den Status SUSPENDED
. Wenn eine Anfrage den Status SUSPENDED
hat, kann sie nicht mehr zugewiesen werden.
Wenn ein Problem mit einer Anfrage auftritt oder die angeforderten Ressourcen nicht verfügbar sind, wechselt die Anfrage in den Status FAILED
.
Sie können den Status der Ressource in der Warteschlange mit den Befehlen gcloud alpha compute tpus queued-resources describe
oder gcloud alpha compute tpus queued-resources list
aufrufen.
Wenn Ressourcenanfragen in der Warteschlange den Status ACTIVE
haben, können Sie Ihre TPU-VMs gemäß dem Nutzerhandbuch für Cloud TPU-VMs verwalten.
Voraussetzungen:
Bevor Sie diesen Leitfaden lesen, stellen Sie Folgendes sicher:
- Alpha-Komponenten der Google Cloud CLI installieren
- Cloud TPU API aktivieren
Ressourcenanfrage in der Warteschlange mit reserviertem Kontingent anfordern
Sie können eine Ressource in der Warteschlange mithilfe des reservierten Kontingents anfordern. Geben Sie dazu das Flag --reserved
im Befehl gcloud
oder guaranteed.reserved=true
in der curl-Anfrage an.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.11.0 \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.11.0', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
project
- Ihr Google Cloud-Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
reserved
- Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.
On-Demand-Ressourcen in der Warteschlange anfordern
Für eine bedarfsgesteuerte Ressource können Sie das Flag --reserved
im Befehl gcloud CLI
oder guaranteed.reserved
in der curl-Anfrage weglassen. Beispiel:
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.11.0 \
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.11.0', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
project
- Ihr Google Cloud-Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
Ressource in der Warteschlange anfordern, die nach einer bestimmten Dauer abläuft
Mit dem Flag --valid-until-duration
können Sie angeben, wie lange eine Ressourcenanfrage in der Warteschlange gültig sein soll. Im folgenden Beispiel wird eine v4-32-Anfrage angefordert, die abläuft, wenn sie nicht innerhalb von sechs Stunden gefüllt wird. Nach der angegebenen Dauer bleibt die Anfrage in der Warteschlange, sie kann jedoch nicht mehr zugewiesen werden.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.11.0-pod \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.11.0-pod', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI-Thema
Ressource in der Warteschlange nach einer bestimmten Zeit anfordern
Mit dem Flag --valid-after-time
können Sie eine Zeit angeben, nach der eine Ressource zugewiesen werden soll.
Der folgende Befehl fordert eine v4-4096-TPU mit Laufzeitversion tpu-vm-tf-2.11.0
an, die nach 9:00 Uhr am 14. Dezember 2022 zugewiesen wird.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.11.0-pod \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.11.0-pod', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
valid-after-time
- Die Zeit, nach der die Ressource zugewiesen werden soll. Weitere Informationen zu Zeitformaten finden Sie unter Datum/Uhrzeit.
Ressource in der Warteschlange vor einem bestimmten Zeitpunkt anfordern
Mit dem Flag --valid-until-time
können Sie einen Zeitpunkt angeben, vor dem die Ressource zugewiesen werden soll. Wenn zu diesem Zeitpunkt keine TPU zugewiesen wurde, bleibt die Anfrage in der Warteschlange, kann jedoch nicht mehr zugewiesen werden.
Der folgende Befehl fordert einen v4-4096-TPU-Knoten mit der Laufzeitversion tpu-vm-tf-2.10.0-pod
an, der spätestens am 14. Dezember 2022 um 9:00 Uhr erstellt wird. Eine Liste der unterstützten Zeitstempelformate finden Sie unter Datetimes.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.11.0-pod \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.11.0-pod', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
valid-until-time
- Die Zeit, nach der die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.
Ressource auf Abruf in der Warteschlange anfordern
Sie können eine Ressource in der Warteschlange auf Abruf anfordern. Eine präemptive Ressource ist eine Ressource, die einer anderen Arbeitslast zugewiesen werden kann, wenn zusätzliche Ressourcen von anderen Arbeitslasten benötigt werden. Ressourcen auf Abruf sind günstiger und Sie erhalten möglicherweise früher Zugriff auf Ressourcen als eine Anfrage auf Abruf.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.11.0 \ --best-effort
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.11.0', } } }, 'best_effort': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
best-effort
- Ein boolesches Flag, das angibt, dass die Ressource in der Warteschlange präemptiv ist.
Ressource in der Warteschlange innerhalb eines bestimmten Zeitraums anfordern
Mit dem Flag --valid-until-duration
können Sie angeben, wie lange die Anfrage gültig sein soll. Wenn die Anfrage nicht vor Ablauf der Dauer zugewiesen wird, bleibt sie in der Warteschlange, kann jedoch nicht mehr zugewiesen werden. Im folgenden Beispiel wird eine v4-32-Zuweisung innerhalb der nächsten sechs Stunden angefordert.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.11.0-pod \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.11.0-pod', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.
Ressource in der Warteschlange innerhalb eines angegebenen Intervalls anfordern
Sie können ein Zuweisungsintervall mit einem beliebigen Paar der Flags –valid-after-time
, –valid-after-duration
, –valid-until-duration
und –valid-until-time
angeben, wobei ein Flag den Beginn des Zuweisungsintervalls und das andere das Ende des Zuweisungsintervalls angibt. Wenn die Anfrage nicht innerhalb der angegebenen Dauer zugewiesen wurde, bleibt sie in der Warteschlange, wird jedoch nicht bereitgestellt.
Mit dem folgenden Befehl wird in 5 Stunden und 30 Minuten ab der aktuellen Uhrzeit eine v4-32 angefordert. Unter Datum/Uhrzeit finden Sie eine Liste der unterstützten Formate für Zeitstempel und Dauer.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.11.0-pod \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.11.0-pod', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
- Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Typ der zu erstellenden Cloud TPU.
runtime-version
- Die Cloud TPU-Softwareversion
valid-until-timw
- Die Zeit, nach der die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.
Ressourcenanfrage in der Warteschlange löschen
Zum Löschen einer Ressourcenanfrage in der Warteschlange müssen Sie zuerst die TPU-VM löschen. Wenn Sie die TPU-VM löschen, wechselt die Anfrage in den Status SUSPENDED
.
Mit den folgenden Befehlen wird die in der Warteschlange befindliche Ressourcenanfrage mit dem Namen „my-queued-resource“ im Projekt „my-project“ in der Zone „us-central2-b“ gelöscht.
gcloud
gcloud alpha compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
HTTP
DELETE https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
project
- Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
Status- und Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange abrufen
Rufen Sie den Status und die Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange ab:
gcloud
gcloud alpha compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
HTTP
GET https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/ us-central2-b/queuedResources/your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
project
- Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
Wenn die Anfrage fehlschlägt, enthält die Antwort Fehlerinformationen. Die Ausgabe von gcloud alpha compute tpus queued-resources describe
sieht in etwa so aus:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: ACCEPTED tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Ressourcenanforderungen in der Warteschlange in Ihrem Projekt auflisten
Der folgende Befehl listet die in der Warteschlange befindlichen Ressourcenanfragen im Projekt „your-project-id“ auf:
gcloud
gcloud alpha compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
HTTP
GET https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources
Beschreibung der Befehls-Flags
project
- Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
Anfragen für Ressourcen in der Warteschlange mit curl verwalten
Zum Ausstellen von Queued Resource API-Befehlen über HTTP ist ein Autorisierungsheader erforderlich.
Sie können den Header abrufen, indem Sie gcloud auth print-access-token
ausführen.
Erstellen Sie eine Datei (z. B. „req.json“), die den HTTP-Anfragetext enthält.
Verwenden Sie zum Anfordern einer einzelnen TPU den folgenden Text im HTTP-Anfragetext:
{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v3-8', runtime_version: 'tpu-vm-tf-2.11.0' } } } }
Verwenden Sie den folgenden Text im HTTP-Anfragetext, um eine einzelne TPU mit einem Startskript anzufordern:
{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.11.0', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } } }
Der folgende Befehl zeigt, wie die HTTP-Anfrage mit curl ausgeführt wird:
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" -d @req.json \ $ENDPOINT/$PARENT/queuedResources\?queued_resource_id\=${QUEUED_RESOURCE_ID}
Die Antwort auf den Befehl sieht in etwa so aus:
{ "name": "projects/your-project-number/locations/us-central1-a/operations/operation-abc..", "metadata": { "@type": "type.googleapis.com/google.cloud.common.OperationMetadata", "createTime": "2022-02-02T22:06:27.402528581Z", "target": "projects/1234/locations/us-central1-a/queuedResources/my-queued-resource", "verb": "create", "cancelRequested": false, "apiVersion": "v2alpha1" }, "done": false }
Sie können den Fortschritt Ihrer Anfrage mit curl prüfen:
export ENDPOINT="https://tpu.googleapis.com/v2alpha1" export OPERATION_NAME="projects/your-project-id/locations/us-central2-b/operations/operation-abc.." curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" $ENDPOINT/${OPERATION_NAME}
Sie können den Status aller Ressourcenanfragen in der Warteschlange in Ihrem Projekt mit curl prüfen:
export ENDPOINT="https://tpu.googleapis.com/v2alpha1" export PARENT="projects/your-project-id/locations/us-central2-b" curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" $ENDPOINT/$PARENT/queuedResources