Nutzerhandbuch für Ressourcen in Warteschlange

Mit Ressourcen in der Warteschlange können Sie Cloud TPU-Ressourcen in Warteschlange anfordern. Wenn Sie Ressourcen in der Warteschlange anfordern, wird die Anfrage einer Warteschlange hinzugefügt, die vom Cloud TPU-Dienst verwaltet wird. Wenn die angeforderte Ressource verfügbar ist, wird sie Ihrem Google Cloud-Projekt zur sofortigen ausschließlichen Verwendung zugewiesen. Es bleibt Ihrem Projekt zugewiesen, bis Sie es löschen oder es vorzeitig beendet wird. Nur TPUs auf Abruf können vorzeitig beendet werden.

Sie können in einer Ressourcenanfrage in der Warteschlange eine optionale Startzeit und/oder Endzeit angeben. Die Startzeit gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wurde eine Anfrage bis zum angegebenen Ende nicht ausgeführt, läuft die Anfrage ab. Die Anfrage verbleibt in der Warteschlange, nachdem sie abgelaufen ist.

Ressourcenanfragen in der Warteschlange können einen der folgenden Status haben:

ACCEPTED
Die Anfrage wurde der Warteschlange hinzugefügt. Er verbleibt in diesem Zustand, bis er zugewiesen wird oder sein Zuweisungsintervall verstrichen ist. Ein Status als ACCEPTED ist keine Garantie dafür, dass der Anfrage ein Kontingent zugewiesen wird. Es kann einige Zeit dauern, bis der Status von ACCEPTED zu ACTIVE wechselt.
PROVISIONING
Die Anfrage wurde aus der Warteschlange ausgewählt und ihre Ressourcen werden gerade zugewiesen.
ACTIVE
Die Anfrage wurde zugewiesen. Wenn Ressourcenanfragen in der Warteschlange den Status ACTIVE haben, können Sie Ihre TPU-VMs wie unter TPUs verwalten beschrieben verwalten.
FAILED
Die Anfrage konnte nicht abgeschlossen werden, weil entweder ein Problem mit der Anfrage vorliegt oder die angeforderten Ressourcen innerhalb des Zuweisungsintervalls nicht verfügbar waren. Die Anfrage bleibt in der Warteschlange, bis sie explizit gelöscht wird.
SUSPENDING
Die mit der Anfrage verknüpften Ressourcen werden gerade gelöscht.
SUSPENDED
Die in der Anfrage angegebenen Ressourcen wurden gelöscht. Wenn eine Anfrage den Status SUSPENDED hat, kann sie nicht mehr zugewiesen werden.

Vorbereitung

Bevor Sie die Befehle in dieser Anleitung ausführen, stellen Sie Folgendes sicher:

On-Demand-Ressource in Warteschlange anfordern

Mit dem Befehl gcloud alpha compute tpus queued-resources create können Sie eine On-Demand-Ressource in der Warteschlange anfordern. Weitere Informationen zu On-Demand-Ressourcen finden Sie unter Kontingenttypen.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.14.0

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.14.0',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.

Standardsegmentgrößen für On-Demand-Ressourcen in der Warteschlange

Wenn Sie ein On-Demand-Kontingent verwenden, müssen Sie eine Segmentgröße anfordern, die kleiner als das Standardlimit für den verwendeten Beschleunigertyp ist. Anfragen, die die Standardlimits überschreiten, werden vom System abgelehnt.

In der folgenden Tabelle sind die TPU-Typen und die zugehörigen Standardlimits aufgeführt.

Beschleunigertyp Standardlimit (in Anzahl der TensorCores)
v2 128
v3 128
v4 384
Version 5 32

Wenn Sie größere Segmentgrößen benötigen, wenden Sie sich an den Cloud TPU-Support, um weitere Informationen zu erhalten.

Ressource in Warteschlange mit reserviertem Kontingent anfordern

Sie können eine Ressource in der Warteschlange mit einem reservierten Kontingent anfordern. Geben Sie dazu das Flag --reserved im Befehl gcloud oder guaranteed.reserved=true in Ihrer curl-Anfrage an. Weitere Informationen zu reservierten Kontingenten finden Sie unter Kontingenttypen.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.14.0 \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.14.0',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
reserved
Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.

Eine präemptive Ressource in der Warteschlange anfordern

Sie können eine präemptive Ressource in der Warteschlange anfordern. Eine Ressource auf Abruf ist eine Ressource, die einer anderen Arbeitslast zugewiesen werden kann, wenn von anderen Arbeitslasten zusätzliche Ressourcen benötigt werden. Ressourcen auf Abruf kosten weniger und Sie erhalten im Vergleich zu Anfragen, die nicht auf Abruf sind, möglicherweise schneller Zugriff auf Ressourcen. Weitere Informationen zu Kontingenten auf Abruf finden Sie unter Kontingenttypen.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.14.0 \
--best-effort

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.14.0',
    }
  }
},
'best_effort': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
best-effort
Ein boolesches Flag, das angibt, dass die Ressource in der Warteschlange auf Abruf verfügbar ist.

Anfordern, dass eine Ressource in der Warteschlange vor oder nach einer bestimmten Zeit zugewiesen wird

Sie können eine optionale Startzeit, Endzeit, Startdauer oder Enddauer für eine in die Warteschlange gestellte Ressourcenanfrage angeben. Die Startzeit oder die Startdauer gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wurde eine Anfrage nicht bis zum angegebenen Ende oder innerhalb der angegebenen Dauer ausgeführt, läuft die Anfrage ab. Nachdem die Anfrage abgelaufen ist, verbleibt sie in der Warteschlange, kann aber nicht mehr zugewiesen werden.

Sie können auch ein Zuordnungsintervall angeben, indem Sie eine Startzeit oder Dauer und eine Endzeit oder -dauer angeben.

Eine Liste der unterstützten Formate für Zeitstempel und Dauer finden Sie unter Datum/Uhrzeit.

Ressource in der Warteschlange nach einer bestimmten Dauer anfordern

Mit dem Flag --valid-after-duration können Sie einen Zeitraum angeben, nach dem eine Ressource zugewiesen werden soll. Im folgenden Beispiel wird die Zuweisung einer v4-32-Instanz nach sechs Stunden angefordert.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.14.0-pod \
--valid-after-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.14.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
valid-after-duration
Die Dauer, innerhalb der die TPU nicht bereitgestellt werden darf. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas

Eine Ressource in der Warteschlange anfordern, die nach einer bestimmten Dauer abläuft

Mit dem Flag --valid-until-duration können Sie angeben, wie lange eine Ressourcenanfrage in der Warteschlange gültig bleibt. Im folgenden Beispiel wird eine v4-32-Anfrage angefordert, die abläuft, wenn sie nicht innerhalb von sechs Stunden ausgefüllt wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.14.0-pod \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.14.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
valid-until-duration
Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas

Ressource in der Warteschlange nach einer bestimmten Zeit anfordern

Mit dem Flag --valid-after-time können Sie einen Zeitpunkt angeben, nach dem eine Ressource zugewiesen werden soll.

Mit dem folgenden Befehl wird eine v4-4096-TPU mit der Laufzeitversion tpu-vm-tf-2.14.0 angefordert, die nach 9:00 Uhr am 14. Dezember 2022 zugewiesen wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.14.0-pod \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.14.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
valid-after-time
Die Zeit, nach der die Ressource zugewiesen werden soll. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.

Ressource in der Warteschlange vor einem bestimmten Zeitpunkt anfordern

Mit dem Flag --valid-until-time können Sie einen Zeitpunkt angeben, vor dem die Ressource zugewiesen werden soll.

Mit dem folgenden Befehl wird ein v4-4096-TPU-Knoten mit der Laufzeitversion tpu-vm-tf-2.10.0-pod angefordert, der spätestens am 14. Dezember 2022 um 9:00 Uhr erstellt wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.14.0-pod \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.14.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
valid-until-time
Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.

Fordert eine Ressource in der Warteschlange an, die innerhalb eines bestimmten Intervalls zugewiesen wird

Sie können ein Zuweisungsintervall mit einem beliebigen Paar der Flags --valid-after-time, --valid-after-duration, --valid-until-duration und --valid-until-time angeben, sofern ein Flag den Beginn des Zuweisungsintervalls und das andere das Ende des Zuweisungsintervalls angibt.

Mit dem folgenden Befehl wird in 5 Stunden und 30 Minuten ab der aktuellen Uhrzeit eine v4-32 angefordert, die spätestens am 14. Dezember 2022 um 09:00 Uhr erstellt wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.14.0-pod \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.14.0-pod',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
valid-until-timw
Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.
valid-until-duration
Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.

Ressource in der Warteschlange mit einem Startup-Skript anfordern

Sie können ein Skript angeben, das für eine Ressource in der Warteschlange ausgeführt werden soll, nachdem diese bereitgestellt wurde. Bei Verwendung des Befehls gcloud können Sie entweder mit dem Flag --metadata oder --metadata-from-file einen Skriptbefehl oder eine Datei mit dem Skriptcode angeben. Wenn Sie curl verwenden, müssen Sie den Skriptcode in den JSON-Inhalt einfügen. Im folgenden Beispiel wird eine Ressourcenanfrage in der Warteschlange erstellt, mit der das in startup-script.sh enthaltene Skript ausgeführt wird. Das Beispiel curl zeigt ein Inline-Skript im JSON-Text.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.14.0',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
validInterval
Der Zeitraum, während dessen die Anfrage gültig ist, nach dem sie abgebrochen wird. Weitere Informationen zu Formaten für die Dauer finden Sie unter Datum/Uhrzeit des Google Cloud CLI-Themas.
metadata-from-file
Gibt eine Datei an, die Metadaten enthält. Wenn Sie keinen voll qualifizierten Pfad zur Metadatendatei angeben, wird davon ausgegangen, dass sie sich im aktuellen Verzeichnis befindet. In diesem Beispiel enthält die Datei ein Startskript, das ausgeführt wird, wenn die Ressource in der Warteschlange bereitgestellt wird.
metadata
Gibt Metadaten für die Anfrage an. In diesem Beispiel sind die Metadaten ein Bootlaufwerk-Befehl, der ausgeführt wird, wenn die Ressource in der Warteschlange bereitgestellt wird.

Ressourcen in der Warteschlange mit einem angegebenen Netzwerk und Subnetzwerk anfordern

Sie können eine Ressource in der Warteschlange anfordern und dabei das Netzwerk und das Subnetzwerk angeben, mit dem Sie die TPU verbinden möchten.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.14.0 \
--network network-name \
--subnetwork subnetwork-name

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.14.0',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Version der Cloud TPU-Software.
reserved
Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.
network
Ein Netzwerk, zu dem die Ressource in der Warteschlange gehört.
subnetwork
Ein Subnetzwerk, zu dem die Ressource in der Warteschlange gehört.

Ressourcenanfrage in der Warteschlange löschen

Sie können eine Ressourcenanfrage in der Warteschlange und die durch die Anfrage erstellte TPU-VM löschen. Übergeben Sie dazu das Flag --force an den Befehl queued-resource delete. Andernfalls müssen Sie die TPU-VM löschen, bevor Sie die in die Warteschlange gestellte Ressourcenanfrage löschen. Wenn Sie die TPU-VM löschen, wechselt die in die Warteschlange gestellte Ressourcenanfrage in den Status SUSPENDED. Danach wird die Ressourcenanfrage in der Warteschlange möglicherweise gelöscht.

Mit den folgenden Befehlen wird die in die Warteschlange gestellte Ressourcenanfrage namens "my-queued-resource" im Projekt "my-project" in Zone "us-central2-b" gelöscht. Mit dem Flag --force werden sowohl die TPU-VM als auch die Ressourcenanfrage in der Warteschlange gelöscht.

gcloud

gcloud alpha compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone der Cloud TPU, die gelöscht werden soll.
force
Löschen Sie sowohl die TPU-VM als auch die Ressourcenanfrage in der Warteschlange.

Mit den folgenden Befehlen wird die in die Warteschlange gestellte Ressourcenanfrage mit dem Namen „my-queued-resource“ im Projekt „my-project“ in der Zone „us-central2-b“ gelöscht.

gcloud

gcloud alpha compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Status- und Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange abrufen

Rufen Sie die Status- und Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange ab:

gcloud

gcloud alpha compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/ us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Ressourcenanfrage in der Warteschlange.
project
Die ID des Projekts, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Wenn die Anfrage fehlschlägt, enthält die Antwort Fehlerinformationen. Für eine akzeptierte Anfrage sieht die Ausgabe in etwa so aus:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: ACCEPTED
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Ressourcenanfragen in der Warteschlange im Projekt auflisten

Der folgende Befehl listet die Ressourcenanfragen in der Warteschlange im Projekt „your-project-id“ auf:

gcloud

gcloud alpha compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

curl

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources

Beschreibung der Befehls-Flags

project
Das Google Cloud-Projekt, dem die Ressource in der Warteschlange zugewiesen wird.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.