Nutzerhandbuch für Ressourcen in der Warteschlange

Mit Ressourcen in der Warteschlange können Sie Cloud TPU-Ressourcen in der Warteschlange anfordern. Wenn Sie in die Warteschlange gestellte Ressourcen anfordern, wird die Anfrage einer vom Cloud TPU-Dienst verwalteten Warteschlange hinzugefügt. Sobald die angeforderte Ressource verfügbar ist, wird sie Ihrem Google Cloud-Projekt zugewiesen und steht Ihnen zur sofortigen und ausschließlichen Nutzung zur Verfügung. Sie bleibt erhalten, die Ihrem Projekt zugewiesen sind, es sei denn, Sie löschen es oder es wird vorzeitig beendet. Nur TPU-Spot-VMs und TPUs auf Abruf können vorzeitig beendet werden.

Sie können in einer Ressourcenanfrage, die sich in der Warteschlange befindet, optional einen Start- und Endzeitpunkt angeben. Der Beginn gibt an, wann die Anfrage frühestens erfüllt werden kann. Wenn eine Anfrage bis zur angegebenen Endzeit nicht erfüllt wurde, läuft sie ab. Die Anfrage bleibt nach Ablauf in der Warteschlange.

Angeforderte Ressourcen können einen der folgenden Status haben:

WAITING_FOR_RESOURCES
Die Anfrage hat die erste Validierung bestanden und wurde der Warteschlange hinzugefügt. Er bleibt in diesem Zustand, bis genügend freie Ressourcen vorhanden sind. die Bereitstellung Ihrer Anfrage oder das Zuweisungsintervall an. Bei hoher Nachfrage können nicht alle Anfragen sofort beantwortet werden bereitgestellt. Wenn Sie eine zuverlässigere Verfügbarkeit von TPUs benötigen, sollten Sie eine Reservierung vornehmen.
PROVISIONING
Die Anfrage wurde aus der Warteschlange ausgewählt und ihre Ressourcen werden zugewiesen.
ACTIVE
Die Anfrage wurde zugewiesen. Wenn Ressourcenanfragen in der Warteschlange ACTIVE haben, können Sie Ihre TPU-VMs wie unter TPUs verwalten.
FAILED
Die Anfrage konnte nicht abgeschlossen werden. Entweder gibt es ein Problem mit dem Anfrage oder die angeforderten Ressourcen waren im Zuweisungsintervall nicht verfügbar. Die Anfrage bleibt in der Warteschlange, bis sie explizit gelöscht wird.
SUSPENDING
Die mit der Anfrage verknüpften Ressourcen werden gelöscht.
SUSPENDED
Die in der Anfrage angegebenen Ressourcen wurden gelöscht. Wenn eine Anfrage den Status SUSPENDED hat, kann sie nicht mehr zugewiesen werden.

Vorbereitung

Bevor Sie die Befehle in dieser Anleitung ausführen, prüfen Sie Folgendes:

On-Demand-Ressource in der Warteschlange anfordern

Mit dem Befehl gcloud compute tpus queued-resources create können Sie eine On-Demand-Ressource in der Warteschlange anfordern. Weitere Informationen zu On-Demand-Ressourcen finden Sie unter Kontingenttypen.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der anstehenden Ressourcenanfrage.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die anstehende Ressourcenanfrage zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.

Standard-Slice-Größen für On-Demand-Ressourcen in der Warteschlange

Wenn Sie ein On-Demand-Kontingent verwenden, muss die Größe des Ausschnitts unter dem Standardlimit für den verwendeten Beschleunigertyp liegen. Anfragen, die die Standardlimits überschreiten, werden vom System abgelehnt.

In der folgenden Tabelle sind die TPU-Typen und die zugehörigen Standardlimits aufgeführt.

Beschleunigertyp Standardbegrenzung (in Anzahl der TensorCores)
v2 128
v3 128
v4 384
v5 32

Wenn Sie größere Slice-Größen benötigen, wenden Sie sich an den Cloud TPU-Support.

Ressourcen in der Warteschlange über eine Reservierung anfordern

Sie können eine in die Warteschlange gestellte Ressource mithilfe einer Reservierung anfordern, indem Sie die --reserved in Ihrem gcloud-Befehl oder guaranteed.reserved=true in Ihrem curl-Anfrage gestellt. Wenden Sie sich an Ihr Google Cloud-Account-Management-Team, um eine Reservierung zu erwerben.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der anstehenden Ressourcenanfrage.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die anstehende Ressourcenanfrage zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Mit dem Beschleunigertyp geben Sie die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Version der Cloud TPU-Software.
reserved
Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU anfordern Reservierung.

TPU-Spot-VM-Ressource in der Warteschlange anfordern

Eine Spot-VM ist eine Ressource, die vorzeitig beendet werden kann und einer anderen Arbeitslast zugewiesen werden. Ressourcen für Spot-VMs sind günstiger und Sie erhalten möglicherweise schneller Zugriff auf Ressourcen als bei einer Anfrage, die nicht auf Spot-VMs basiert. Weitere Informationen zu TPU-Spot-VMs finden Sie unter TPU-Spot-VMs verwalten.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --spot

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt'
    }
  }
},
'spot': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die erwartete Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Version der Cloud TPU-Software.
spot
Ein boolesches Flag, das angibt, dass die Ressource in der Warteschlange eine Spot-VM ist.

Anfordern, dass eine in der Warteschlange befindliche Ressource vor oder nach einer bestimmten Zeit zugewiesen wird

Sie können optional einen Beginn, ein Ende Uhrzeit, Start Dauer oder Ende Dauer in einer Ressourcenanfrage in der Warteschlange. Mit der Startzeit oder Startdauer wird der früheste Zeitpunkt angegeben, zu dem die Anfrage erfüllt werden kann. Wenn eine Anfrage bis zum angegebenen Ende oder innerhalb der der angegebenen Dauer, läuft die Anfrage ab. Nach Ablauf der Anfrage bleibt sie in der Warteschlange, kann aber nicht mehr zugewiesen werden.

Sie können auch ein Zuweisungsintervall festlegen, indem Sie Sie geben eine Startzeit oder Dauer und ein Ende oder eine Dauer an.

Weitere Informationen finden Sie unter Datetime für ein Liste der unterstützten Formate für Zeitstempel und Dauer.

Ressource in der Warteschlange nach einem bestimmten Zeitraum anfordern

Sie können den Zeitraum angeben, nach dem eine Ressource zugewiesen werden soll. Verwenden Sie dazu Das Flag --valid-after-duration. Im folgenden Beispiel wird eine Version 4-32 angefordert, nach sechs Stunden zugewiesen werden.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die in die Warteschlange gestellte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Mit dem Beschleunigertyp geben Sie die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Version der Cloud TPU-Software.
valid-after-duration
Die Dauer, vor der die TPU nicht bereitgestellt werden darf. Weitere Informationen zu Zeitformaten finden Sie im Google Cloud CLI-Thema „datetime“
.

Eine in der Warteschlange befindliche Ressource anfordern, die nach einer bestimmten Zeit abläuft

Sie können angeben, wie lange eine Ressourcenanfrage in der Warteschlange gültig bleibt, indem Sie Das Flag --valid-until-duration. Im folgenden Beispiel wird ein v4-32 angefordert, das abläuft, wenn es nicht innerhalb von sechs Stunden ausgefüllt wird.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die in die Warteschlange gestellte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-until-duration
Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Zeitformaten finden Sie im Google Cloud CLI-Thema „datetime“
.

Eine Ressource in der Warteschlange nach einer bestimmten Zeit anfordern

Mit dem Flag --valid-after-time können Sie einen Zeitpunkt angeben, nach dem eine Ressource zugewiesen werden soll.

Mit dem folgenden Befehl wird eine TPU v4-4096 mit der Laufzeitversion tpu-vm-tf-2.17.0-pjrt angefordert, die nach dem 14. Dezember 2022 um 9:00 Uhr zugewiesen werden soll.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-4096 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, in dem die erwartete Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-after-time
Die Zeit, nach der die Ressource zugewiesen werden soll. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „Datum/Uhrzeit“.

Eine in der Warteschlange befindliche Ressource vor einer bestimmten Zeit anfordern

Mit dem Flag --valid-until-time können Sie eine Zeit angeben, vor der die Ressource zugewiesen werden soll.

Mit dem folgenden Befehl wird eine v4-4096-TPU mit Laufzeitversion tpu-vm-tf-2.10.0-pod, die spätestens am 14. Dezember 2022 um 09:00 Uhr erstellt wird.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-4096 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die in die Warteschlange gestellte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Version der Cloud TPU-Software.
valid-until-time
Der Zeitpunkt, nach dem die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.

Anfordern, dass eine in der Warteschlange befindliche Ressource innerhalb eines bestimmten Intervalls zugewiesen wird

Sie können ein Zuweisungsintervall mit einem beliebigen Paar der Flags --valid-after-time, --valid-after-duration, --valid-until-duration und --valid-until-time angeben, sofern mit einem Flag der Beginn und mit dem anderen das Ende des Zuweisungszeitraums angegeben wird.

Mit dem folgenden Befehl wird in 5 Stunden und 30 Minuten vom bis zum 14. Dezember 2022 um 09:00 Uhr erstellt werden.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project-id \
  --zone us-central2-b \
  --accelerator-type v4-32 \
  --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \
  --valid-after-duration 5h30m \
  --valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die erwartete Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
valid-until-timw
Der Zeitpunkt, nach dem die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.
valid-until-duration
Die Gültigkeitsdauer der Anfrage. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI.

Eine in der Warteschlange befindliche Ressource mit einem Startskript anfordern

Sie können ein Script angeben, das auf einer in der Warteschlange befindlichen Ressource ausgeführt werden soll, nachdem sie bereitgestellt wurde. Mit dem Befehl gcloud können Sie entweder den --metadata oder --metadata-from-file, um einen Skriptbefehl oder eine Datei mit den Skript-Code. Wenn Sie curl verwenden, müssen Sie den Scriptcode in den JSON-Inhalt einfügen. Im folgenden Beispiel wird eine anstehende Ressourcenanfrage erstellt, mit der das in startup-script.sh enthaltene Script ausgeführt wird. Das curl Das Beispiel zeigt ein Inline-Skript im JSON-Textkörper.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.12.0 \
  --metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.17.0-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die in die Warteschlange gestellte Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Mit dem Beschleunigertyp geben Sie die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Version der Cloud TPU-Software.
validInterval
Die Gültigkeit der Anfrage abgebrochen. Weitere Informationen zu Dauerformaten findest du unter Datum/Uhrzeit des Google Cloud CLI-Themas
metadata-from-file
Gibt eine Datei an, die Metadaten enthält. Wenn Sie keinen vollständig qualifizierten Pfad zur Metadatendatei angeben, geht der Befehl davon aus, dass sie sich im aktuellen Verzeichnis befindet. In diesem Beispiel enthält die Datei ein Startskript, wird ausgeführt, wenn die in die Warteschlange gestellte Ressource bereitgestellt wird.
metadata
Gibt Metadaten für die Anfrage an. In diesem Beispiel sind die Metadaten ein Startskriptbefehl, der ausgeführt wird, wenn die erwartete Ressource bereitgestellt wird.

Angestellte Ressourcen mit einem bestimmten Netzwerk und Subnetzwerk anfordern

Sie können eine in die Warteschlange gestellte Ressource anfordern, indem Sie das Netzwerk und das Subnetzwerk angeben, mit dem Sie Ihre TPU verbinden möchten.

gcloud

gcloud compute tpus queued-resources create your-queued-resource-id \
  --node-id your-node-id \
  --project your-project \
  --zone us-central2-b \
  --accelerator-type v4-8 \
  --runtime-version tpu-vm-tf-2.17.0-pjrt \
  --network network-name \
  --subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.17.0-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der anstehenden Ressourcenanfrage.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die anstehende Ressourcenanfrage zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
runtime-version
Die Cloud TPU-Softwareversion.
reserved
Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU anfordern Reservierung.
network
Ein Netzwerk, zu dem die Ressource in der Warteschlange gehört.
subnetwork
Ein Subnetzwerk, zu dem die in die Warteschlange gestellte Ressource gehört.

Ressourcenanfrage in der Warteschlange löschen

Sie können eine angeforderte Ressource in der Warteschlange und die TPU-VM, die durch die Anfrage erstellt wurde, löschen, indem Sie dem Befehl queued-resource delete das Flag --force übergeben. Andernfalls müssen Sie die TPU-VM löschen, bevor Sie die anstehende Ressourcenanfrage löschen. Wenn Sie die TPU-VM löschen, wechselt die Anfrage für die in die Warteschlange gestellte Ressource in den Status SUSPENDED. Danach wird sie möglicherweise gelöscht.

Mit den folgenden Befehlen wird die Anfrage für die in die Warteschlange gestellte Ressource namens „my-queued-resource“ im Projekt „my-project“ in der Zone „us-central2-b“ gelöscht. Dabei wird das Flag --force verwendet, um sowohl die TPU-VM als auch die angeforderte Ressource in der Warteschlange zu löschen.

gcloud

gcloud compute tpus queued-resources delete my-queued-resource \
  --project my-project \
  --zone us-central2-b \
  --force \
  --async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der anstehenden Ressourcenanfrage.
project
Das Google Cloud-Projekt, dem die in die Warteschlange gestellte Ressource zugewiesen ist.
zone
Die Zone der Cloud TPU, die gelöscht werden soll.
force
Löschen Sie sowohl die TPU-VM als auch die Anfrage für die in die Warteschlange gestellte Ressource.

Mit den folgenden Befehlen wird die Anfrage für die in die Warteschlange gestellte Ressource namens „my-queued-resource“ im Projekt „my-project“ in der Zone „us-central2-b“ gelöscht.

gcloud

gcloud compute tpus queued-resources delete your-queued-resource-id \
  --project your-project-id \
  --zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der anstehenden Ressourcenanfrage.
project
Das Google Cloud-Projekt, in dem die erwartete Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Status- und Diagnoseinformationen zu einer anstehenden Ressourcenanfrage abrufen

Status- und Diagnoseinformationen zu einer anstehenden Ressourcenanfrage abrufen:

gcloud

gcloud compute tpus queued-resources describe queued-resource-request-id \
  --project your-project-id \
  --zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der anstehenden Ressourcenanfrage.
project
Die ID des Projekts, dem die erwartete Ressource zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Wenn die Anfrage fehlschlägt, enthält die Antwort Fehlerinformationen. Bei einer Anfrage, die auf Ressourcen wartet, sieht die Ausgabe in etwa so aus:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Ressourcenanfragen in der Warteschlange im Projekt auflisten

Der folgende Befehl listet die in der Warteschlange gestellten Ressourcenanfragen im Projekt "your-project-id" auf:

gcloud

gcloud compute tpus queued-resources list --project your-project-id \
  --zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources

Beschreibung der Befehls-Flags

project
Das Google Cloud-Projekt, in dem die erwartete Ressource zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.