Nutzerhandbuch für Ressourcen in der Warteschlange

Mit Ressourcen in der Warteschlange können Sie Cloud TPU-Ressourcen in der Warteschlange anfordern. Wenn Sie Ressourcen in der Warteschlange anfordern, wird die Anfrage einer Warteschlange hinzugefügt, die vom Cloud TPU-Dienst verwaltet wird. Wenn die angeforderte Ressource verfügbar ist, wird sie Ihrem Google Cloud-Projekt zur unmittelbaren exklusiven Verwendung zugewiesen. Es bleibt Ihrem Projekt zugewiesen, bis Sie es löschen oder es vorzeitig beendet wird. Nur TPU Spot-VMs und TPUs auf Abruf können vorzeitig beendet werden.

Sie können in einer Ressourcenanfrage in der Warteschlange eine optionale Start- und Endzeit angeben. Die Startzeit gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wenn eine Anfrage bis zum angegebenen Ende nicht ausgeführt wurde, läuft sie ab. Die Anfrage bleibt nach ihrem Ablauf in der Warteschlange.

Ressourcenanfragen in der Warteschlange können einen der folgenden Status haben:

WAITING_FOR_RESOURCES
Die Anfrage hat die erste Validierung bestanden und wurde der Warteschlange hinzugefügt. Er bleibt in diesem Status, bis genügend freie Ressourcen zum Bereitstellen der Anfrage vorhanden sind oder das Zuweisungsintervall abgelaufen ist. Bei hoher Nachfrage können nicht alle Anfragen sofort bereitgestellt werden. Wenn Sie eine zuverlässigere Verfügbarkeit von TPUs benötigen, sollten Sie den Kauf einer Reservierung in Betracht ziehen.
PROVISIONING
Die Anfrage wurde aus der Warteschlange ausgewählt und ihre Ressourcen werden gerade zugewiesen.
ACTIVE
Die Anfrage wurde zugewiesen. Wenn Ressourcenanfragen in der Warteschlange den Status ACTIVE haben, können Sie Ihre TPU-VMs wie unter TPUs verwalten beschrieben verwalten.
FAILED
Die Anfrage konnte nicht abgeschlossen werden, entweder weil ein Problem mit der Anfrage vorliegt oder die angeforderten Ressourcen nicht innerhalb des Zuweisungsintervalls verfügbar waren. Die Anfrage bleibt in der Warteschlange, bis sie explizit gelöscht wird.
SUSPENDING
Die mit der Anfrage verknüpften Ressourcen werden gerade gelöscht.
SUSPENDED
Die in der Anfrage angegebenen Ressourcen wurden gelöscht. Wenn eine Anfrage den Status SUSPENDED hat, kann sie nicht mehr zugewiesen werden.

Vorbereitung

Bevor Sie die Befehle in dieser Anleitung ausführen, prüfen Sie Folgendes:

On-Demand-Ressource in der Warteschlange anfordern

Mit dem Befehl gcloud compute tpus queued-resources create können Sie eine On-Demand-Ressource in der Warteschlange anfordern. Weitere Informationen zu On-Demand-Ressourcen finden Sie unter Kontingenttypen.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die bei der Zuweisung der Ressourcenanfrage in der Warteschlange erstellt wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.

Standard-Slice-Größen für On-Demand-Ressourcen in der Warteschlange

Wenn Sie ein On-Demand-Kontingent verwenden, müssen Sie eine Slice-Größe anfordern, die unter dem Standardlimit für den verwendeten Beschleunigertyp liegt. Anfragen, die die Standardlimits überschreiten, werden vom System abgelehnt.

In der folgenden Tabelle sind die TPU-Typen und die zugehörigen Standardlimits aufgeführt.

Beschleunigertyp Standardlimit (Anzahl der TensorCores)
v2 128
v3 128
v4 384
v5 32

Wenn Sie größere Slices benötigen, wenden Sie sich an den Cloud TPU-Support, um weitere Informationen zu erhalten.

Ressource in der Warteschlange mithilfe einer Reservierung anfordern

Sie können eine Ressource in der Warteschlange mit einer Reservierung anfordern, indem Sie das Flag --reserved im Befehl gcloud oder in der curl-Anfrage das Flag guaranteed.reserved=true angeben. Wenn Sie eine Reservierung kaufen möchten, wenden Sie sich an Ihr Account-Management-Team für Google Cloud.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die bei der Zuweisung der Ressourcenanfrage in der Warteschlange erstellt wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
reserved
Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.

TPU Spot-VM-Ressource in der Warteschlange anfordern

Eine Spot-VM ist eine Ressource, die jederzeit vorzeitig beendet und einer anderen Arbeitslast zugewiesen werden kann. Spot-VM-Ressourcen kosten weniger und Sie erhalten möglicherweise früher Zugriff auf Ressourcen als eine Nicht-Spot-VM-Anfrage. Weitere Informationen zu TPU-Spot-VMs finden Sie unter TPU Spot-VMs verwalten.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die in die Warteschlange gestellte Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
spot
Ein boolesches Flag, das angibt, dass die Ressource in der Warteschlange eine Spot-VM ist.

Fordern Sie eine Ressource in der Warteschlange an, die vor oder nach einer bestimmten Zeit zugewiesen wird

Sie können in einer Ressourcenanfrage in der Warteschlange optional eine Startzeit, Ende, Startdauer oder Ende angeben. Die Startzeit oder Startdauer gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wenn eine Anfrage bis zum angegebenen Ende oder innerhalb der angegebenen Dauer nicht ausgeführt wurde, läuft sie ab. Nachdem die Anfrage abgelaufen ist, verbleibt sie in der Warteschlange, kann aber nicht mehr zugewiesen werden.

Sie können auch ein Zuweisungsintervall festlegen, indem Sie eine Startzeit oder -dauer und eine Endzeit oder -dauer angeben.

Eine Liste der unterstützten Formate für Zeitstempel und Dauer finden Sie unter Datetime.

Ressource in der Warteschlange nach einem bestimmten Zeitraum anfordern

Mit dem Flag --valid-after-duration können Sie einen Zeitraum angeben, nach dem eine Ressource zugewiesen werden soll. Im folgenden Beispiel wird die Zuweisung einer v4-32-Instanz nach sechs Stunden angefordert.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-after-duration
Die Dauer, vor der die TPU nicht bereitgestellt werden darf. Weitere Informationen zu Dauerformaten finden Sie unter Google Cloud CLI-Thema „datetime“.

Ressource in der Warteschlange anfordern, die nach einem bestimmten Zeitraum abläuft

Mit dem Flag --valid-until-duration können Sie festlegen, wie lange eine Anfrage an eine Ressource in der Warteschlange gültig bleibt. Im folgenden Beispiel wird eine Version 4-32 angefordert, die abläuft, wenn das Feld nicht innerhalb von sechs Stunden ausgefüllt wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-until-duration
Die Gültigkeitsdauer der Anfrage. Weitere Informationen zu Dauerformaten finden Sie unter Google Cloud CLI-Thema „datetime“.

Eine Ressource in der Warteschlange nach einer bestimmten Zeit anfordern

Mit dem Flag --valid-after-time können Sie einen Zeitpunkt angeben, nach dem eine Ressource zugewiesen werden soll.

Mit dem folgenden Befehl wird eine v4-4096 TPU mit der Laufzeitversion tpu-vm-tf-2.16.1-pjrt angefordert, die nach 09:00 Uhr am 14. Dezember 2022 zugewiesen wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-after-time
Der Zeitpunkt, nach dem die Ressource zugewiesen werden sollte. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.

Ressource in der Warteschlange vor einer bestimmten Zeit anfordern

Mit dem Flag --valid-until-time können Sie einen Zeitpunkt angeben, vor dem die Ressource zugewiesen werden soll.

Mit dem folgenden Befehl wird eine v4-4096 TPU mit der Laufzeitversion tpu-vm-tf-2.10.0-pod angefordert, die spätestens am 14. Dezember 2022 um 09:00 Uhr erstellt wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die in die Warteschlange gestellte Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-until-time
Der Zeitpunkt, nach dem die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.

Fordern Sie eine Ressource in der Warteschlange an, die innerhalb eines bestimmten Intervalls zugewiesen wird

Sie können ein Zuweisungsintervall mit einem beliebigen Paar der Flags --valid-after-time, --valid-after-duration, --valid-until-duration und --valid-until-time angeben. Dabei muss ein Flag den Beginn des Zuweisungsintervalls und das andere das Ende des Zuweisungsintervalls angeben.

Mit dem folgenden Befehl wird in 5 Stunden und 30 Minuten ab der aktuellen Uhrzeit eine v4-32 angefordert, die spätestens am 14. Dezember 2022 um 09:00 Uhr erstellt werden muss.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die in die Warteschlange gestellte Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-until-timw
Der Zeitpunkt, nach dem die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.
valid-until-duration
Die Gültigkeitsdauer der Anfrage. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.

Ressource in der Warteschlange mit einem Startskript anfordern

Sie können ein Skript angeben, das nach der Bereitstellung für eine Ressource in der Warteschlange ausgeführt werden soll. Wenn Sie den Befehl gcloud verwenden, können Sie entweder das Flag --metadata oder --metadata-from-file verwenden, um einen Skriptbefehl bzw. eine Datei mit dem Skriptcode anzugeben. Wenn Sie curl verwenden, müssen Sie den Skriptcode in den JSON-Inhalt aufnehmen. Im folgenden Beispiel wird eine Ressourcenanfrage in der Warteschlange erstellt, die das in startup-script.sh enthaltene Skript ausführt. Das Beispiel curl zeigt ein Inline-Skript im JSON-Text.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.16.1-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die in die Warteschlange gestellte Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
validInterval
Die Gültigkeit der Anfrage, nach der sie abgebrochen wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.
metadata-from-file
Gibt eine Datei an, die Metadaten enthält. Wenn Sie keinen voll qualifizierten Pfad zur Metadatendatei angeben, geht der Befehl davon aus, dass sie sich im aktuellen Verzeichnis befindet. In diesem Beispiel enthält die Datei ein Startskript, das bei der Bereitstellung der in die Warteschlange gestellten Ressource ausgeführt wird.
metadata
Gibt Metadaten für die Anfrage an. In diesem Beispiel sind die Metadaten ein Startskriptbefehl, der bei der Bereitstellung der Ressource in der Warteschlange ausgeführt wird.

Ressourcen in der Warteschlange mit einem angegebenen Netzwerk und Subnetzwerk anfordern

Sie können eine Ressource in der Warteschlange anfordern, in der das Netzwerk und das Subnetzwerk angegeben ist, mit dem Sie die TPU verbinden möchten.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die bei der Zuweisung der Ressourcenanfrage in der Warteschlange erstellt wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
reserved
Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.
network
Ein Netzwerk, zu dem die Ressource in der Warteschlange gehört.
subnetwork
Ein Subnetzwerk, zu dem die in die Warteschlange gestellte Ressource gehört.

Ressourcenanfrage in der Warteschlange löschen

Sie können eine Anfrage an eine Ressource in der Warteschlange und die von der Anfrage erstellte TPU-VM löschen. Dazu übergeben Sie das Flag --force an den Befehl queued-resource delete. Andernfalls müssen Sie die TPU-VM löschen, bevor Sie die Ressourcenanfrage in der Warteschlange löschen. Wenn Sie die TPU-VM löschen, wechselt die Anfrage zur Ressource in der Warteschlange in den Status SUSPENDED. Danach wird die Ressourcenanfrage in der Warteschlange möglicherweise gelöscht.

Mit den folgenden Befehlen wird die Anfrage an eine Warteschlange mit dem Namen "my-queued-resource" im Projekt "my-project" in der Zone "us-central2-b" gelöscht. Dabei wird das Flag --force verwendet, um sowohl die TPU-VM als auch die Ressourcenanfrage in der Warteschlange zu löschen.

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
Das Google Cloud-Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
Die Zone der Cloud TPU, die gelöscht werden soll.
force
Löschen Sie sowohl die TPU-VM als auch die Ressourcenanfrage in der Warteschlange.

Mit den folgenden Befehlen wird die Anfrage für eine Ressource mit dem Namen "my-queued-resource" im Projekt "my-project" in der Zone "us-central2-b" gelöscht.

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
Das Google Cloud-Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Status- und Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange abrufen

Rufen Sie die Status- und Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange ab:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
Die ID des Projekts, dem die in die Warteschlange gestellte Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Wenn die Anfrage fehlschlägt, enthält die Antwort Fehlerinformationen. Für eine Anfrage, die auf Ressourcen wartet, sieht die Ausgabe in etwa so aus:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Ressourcenanfragen in der Warteschlange im Projekt auflisten

Der folgende Befehl listet die in der Warteschlange gestellten Ressourcenanfragen im Projekt "your-project-id" auf:

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Beschreibung der Befehls-Flags

project
Das Google Cloud-Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.