Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Nutzerhandbuch für Ressourcen in der Warteschlange

Mit Ressourcen in der Warteschlange können Sie Cloud TPU-Ressourcen in einer Warteschlange anfordern. Wenn Sie Ressourcen in der Warteschlange anfordern, wird die Anfrage einer Warteschlange hinzugefügt, die vom Cloud TPU-Dienst verwaltet wird. Wenn die angeforderte Ressource verfügbar ist, wird sie Ihrem Google Cloud-Projekt zur sofortigen exklusiven Nutzung zugewiesen. Er bleibt so lange Ihrem Projekt zugewiesen, bis Sie ihn löschen oder präemptiv beendet werden. Nur präemptive TPUs können vorzeitig beendet werden.

Sie können in einer Ressourcenanfrage in der Warteschlange eine optionale Startzeit und/oder eine Endzeit angeben. Die Startzeit gibt den frühesten Zeitpunkt an, zu dem die Anfrage ausgeführt werden soll. Wenn eine Anfrage nicht bis zum angegebenen Ende ausgeführt wurde, läuft sie ab. Die Anfrage bleibt in der Warteschlange, nachdem sie abgelaufen ist.

Anfragen von Ressourcen in der Warteschlange können einen der folgenden Status haben:

ACCEPTED
Die Anfrage wurde der Warteschlange hinzugefügt.
ACTIVE
Die Anfrage wurde zugewiesen.
FAILED
Die Anfrage konnte nicht abgeschlossen werden.
SUSPENDED
Die in der Anfrage angegebenen Ressourcen wurden gelöscht.

Wenn eine Ressourcenanfrage in der Warteschlange der Warteschlange hinzugefügt wird, wird ihr Status auf ACCEPTED gesetzt. Er bleibt in diesem Zustand, bis er zugewiesen wird oder sein Zuweisungsintervall abläuft.

Wenn die Anfrage zugewiesen ist, wird ihr Status auf ACTIVE gesetzt. Wenn ein Zuweisungsintervall einer Anfrage abläuft, bleibt sein Status im Status ACCEPTED, kann aber nicht mehr zugewiesen werden. Anfragen in der Warteschlange bleiben so lange in der Warteschlange, bis sie explizit gelöscht werden.

Wenn die in einer Anfrage angegebenen Ressourcen gelöscht werden, wechselt die Anfrage in den Status SUSPENDED. Wenn eine Anfrage den Status SUSPENDED hat, kann sie nicht mehr zugewiesen werden.

Wenn ein Problem mit einer Anfrage auftritt oder die angeforderten Ressourcen nicht verfügbar sind, wechselt die Anfrage in den Status FAILED.

Sie können den Status der Ressource in der Warteschlange mit den Befehlen gcloud alpha compute tpus queued-resources describe oder gcloud alpha compute tpus queued-resources list aufrufen.

Wenn Ressourcenanfragen in der Warteschlange den Status ACTIVE haben, können Sie Ihre TPU-VMs gemäß dem Nutzerhandbuch für Cloud TPU-VMs verwalten.

Voraussetzungen:

Bevor Sie diesen Leitfaden lesen, stellen Sie Folgendes sicher:

Ressourcenanfrage in der Warteschlange mit reserviertem Kontingent anfordern

Sie können eine Ressource in der Warteschlange mithilfe des reservierten Kontingents anfordern. Geben Sie dazu das Flag --reserved im Befehl gcloud oder guaranteed.reserved=true in der curl-Anfrage an.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.11.0 \
--reserved

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.11.0',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion
reserved
Verwenden Sie dieses Flag, wenn Sie Ressourcen in der Warteschlange als Teil einer Cloud TPU-Reservierung anfordern.

On-Demand-Ressourcen in der Warteschlange anfordern

Für eine bedarfsgesteuerte Ressource können Sie das Flag --reserved im Befehl gcloud CLI oder guaranteed.reserved in der curl-Anfrage weglassen. Beispiel:

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.11.0 \

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.11.0',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die Ressourcenanfrage in der Warteschlange zugewiesen wird.
project
Ihr Google Cloud-Projekt.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion

Ressource in der Warteschlange anfordern, die nach einer bestimmten Dauer abläuft

Mit dem Flag --valid-until-duration können Sie angeben, wie lange eine Ressourcenanfrage in der Warteschlange gültig sein soll. Im folgenden Beispiel wird eine v4-32-Anfrage angefordert, die abläuft, wenn sie nicht innerhalb von sechs Stunden gefüllt wird. Nach der angegebenen Dauer bleibt die Anfrage in der Warteschlange, sie kann jedoch nicht mehr zugewiesen werden.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.11.0-pod \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.11.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion
valid-until-duration
Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit der Google Cloud CLI-Thema

Ressource in der Warteschlange nach einer bestimmten Zeit anfordern

Mit dem Flag --valid-after-time können Sie eine Zeit angeben, nach der eine Ressource zugewiesen werden soll.

Der folgende Befehl fordert eine v4-4096-TPU mit Laufzeitversion tpu-vm-tf-2.11.0 an, die nach 9:00 Uhr am 14. Dezember 2022 zugewiesen wird.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.11.0-pod \
--valid-after-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.11.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion
valid-after-time
Die Zeit, nach der die Ressource zugewiesen werden soll. Weitere Informationen zu Zeitformaten finden Sie unter Datum/Uhrzeit.

Ressource in der Warteschlange vor einem bestimmten Zeitpunkt anfordern

Mit dem Flag --valid-until-time können Sie einen Zeitpunkt angeben, vor dem die Ressource zugewiesen werden soll. Wenn zu diesem Zeitpunkt keine TPU zugewiesen wurde, bleibt die Anfrage in der Warteschlange, kann jedoch nicht mehr zugewiesen werden.

Der folgende Befehl fordert einen v4-4096-TPU-Knoten mit der Laufzeitversion tpu-vm-tf-2.10.0-pod an, der spätestens am 14. Dezember 2022 um 9:00 Uhr erstellt wird. Eine Liste der unterstützten Zeitstempelformate finden Sie unter Datetimes.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.11.0-pod \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.11.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion
valid-until-time
Die Zeit, nach der die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.

Ressource auf Abruf in der Warteschlange anfordern

Sie können eine Ressource in der Warteschlange auf Abruf anfordern. Eine präemptive Ressource ist eine Ressource, die einer anderen Arbeitslast zugewiesen werden kann, wenn zusätzliche Ressourcen von anderen Arbeitslasten benötigt werden. Ressourcen auf Abruf sind günstiger und Sie erhalten möglicherweise früher Zugriff auf Ressourcen als eine Anfrage auf Abruf.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.11.0 \
--best-effort

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.11.0',
    }
  }
},
'best_effort': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion
best-effort
Ein boolesches Flag, das angibt, dass die Ressource in der Warteschlange präemptiv ist.

Ressource in der Warteschlange innerhalb eines bestimmten Zeitraums anfordern

Mit dem Flag --valid-until-duration können Sie angeben, wie lange die Anfrage gültig sein soll. Wenn die Anfrage nicht vor Ablauf der Dauer zugewiesen wird, bleibt sie in der Warteschlange, kann jedoch nicht mehr zugewiesen werden. Im folgenden Beispiel wird eine v4-32-Zuweisung innerhalb der nächsten sechs Stunden angefordert.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.11.0-pod \
--valid-until-duration 6h

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.11.0-pod',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibungen der Befehlsparameter

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion
valid-until-duration
Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.

Ressource in der Warteschlange innerhalb eines angegebenen Intervalls anfordern

Sie können ein Zuweisungsintervall mit einem beliebigen Paar der Flags –valid-after-time, –valid-after-duration, –valid-until-duration und –valid-until-time angeben, wobei ein Flag den Beginn des Zuweisungsintervalls und das andere das Ende des Zuweisungsintervalls angibt. Wenn die Anfrage nicht innerhalb der angegebenen Dauer zugewiesen wurde, bleibt sie in der Warteschlange, wird jedoch nicht bereitgestellt.

Mit dem folgenden Befehl wird in 5 Stunden und 30 Minuten ab der aktuellen Uhrzeit eine v4-32 angefordert. Unter Datum/Uhrzeit finden Sie eine Liste der unterstützten Formate für Zeitstempel und Dauer.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.11.0-pod \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

curl

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.11.0-pod',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
node-id
Die benutzerdefinierte ID der TPU, die als Antwort auf die Anfrage erstellt wurde.
project
Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
Der Typ der zu erstellenden Cloud TPU.
runtime-version
Die Cloud TPU-Softwareversion
valid-until-timw
Die Zeit, nach der die Anfrage storniert wird. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.
valid-until-duration
Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie unter Datum/Uhrzeit für die Google Cloud CLI.

Ressourcenanfrage in der Warteschlange löschen

Zum Löschen einer Ressourcenanfrage in der Warteschlange müssen Sie zuerst die TPU-VM löschen. Wenn Sie die TPU-VM löschen, wechselt die Anfrage in den Status SUSPENDED.

Mit den folgenden Befehlen wird die in der Warteschlange befindliche Ressourcenanfrage mit dem Namen „my-queued-resource“ im Projekt „my-project“ in der Zone „us-central2-b“ gelöscht.

gcloud

gcloud alpha compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

curl

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

HTTP

DELETE https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
project
Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Status- und Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange abrufen

Rufen Sie den Status und die Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange ab:

gcloud

gcloud alpha compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

HTTP

GET https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/ us-central2-b/queuedResources/your-queued-resource-id

Beschreibung der Befehls-Flags

queued-resource-request-id
Die vom Nutzer zugewiesene ID der Anfrage in der Warteschlange.
project
Die ID des Projekts, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Wenn die Anfrage fehlschlägt, enthält die Antwort Fehlerinformationen. Die Ausgabe von gcloud alpha compute tpus queued-resources describe sieht in etwa so aus:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: ACCEPTED
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Ressourcenanforderungen in der Warteschlange in Ihrem Projekt auflisten

Der folgende Befehl listet die in der Warteschlange befindlichen Ressourcenanfragen im Projekt „your-project-id“ auf:

gcloud

gcloud alpha compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

HTTP

GET https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources

Beschreibung der Befehls-Flags

project
Das Google Cloud-Projekt, dem die Warteschlange zugewiesen ist.
zone
Die Zone, in der Sie die Cloud TPU erstellen möchten.

Anfragen für Ressourcen in der Warteschlange mit curl verwalten

Zum Ausstellen von Queued Resource API-Befehlen über HTTP ist ein Autorisierungsheader erforderlich. Sie können den Header abrufen, indem Sie gcloud auth print-access-token ausführen.

Erstellen Sie eine Datei (z. B. „req.json“), die den HTTP-Anfragetext enthält.

Verwenden Sie zum Anfordern einer einzelnen TPU den folgenden Text im HTTP-Anfragetext:

{
    tpu: {
        node_spec: {
            parent: 'projects/your-project-number/locations/us-central2-b',
            node_id: 'your-node-id',
            node: {
                accelerator_type: 'v3-8',
                runtime_version: 'tpu-vm-tf-2.11.0'
            }
        }
    }
}

Verwenden Sie den folgenden Text im HTTP-Anfragetext, um eine einzelne TPU mit einem Startskript anzufordern:

{
    tpu: {
        node_spec: {
            parent: 'projects/your-project-number/locations/us-central2-b',
            node_id: 'your-node-id',
            node: {
                accelerator_type: 'v2-8',
                runtime_version: 'tpu-vm-tf-2.11.0',
                metadata: {
                    "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
                }
            }
        }
    }
}

Der folgende Befehl zeigt, wie die HTTP-Anfrage mit curl ausgeführt wird:

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" -d @req.json \
  $ENDPOINT/$PARENT/queuedResources\?queued_resource_id\=${QUEUED_RESOURCE_ID}

Die Antwort auf den Befehl sieht in etwa so aus:

{
    "name": "projects/your-project-number/locations/us-central1-a/operations/operation-abc..",
    "metadata": {
        "@type": "type.googleapis.com/google.cloud.common.OperationMetadata",
        "createTime": "2022-02-02T22:06:27.402528581Z",
        "target": "projects/1234/locations/us-central1-a/queuedResources/my-queued-resource",
        "verb": "create",
        "cancelRequested": false,
        "apiVersion": "v2alpha1"
    },
    "done": false
}

Sie können den Fortschritt Ihrer Anfrage mit curl prüfen:

export ENDPOINT="https://tpu.googleapis.com/v2alpha1"
export OPERATION_NAME="projects/your-project-id/locations/us-central2-b/operations/operation-abc.."
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" $ENDPOINT/${OPERATION_NAME}

Sie können den Status aller Ressourcenanfragen in der Warteschlange in Ihrem Projekt mit curl prüfen:

export ENDPOINT="https://tpu.googleapis.com/v2alpha1"
export PARENT="projects/your-project-id/locations/us-central2-b"
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" $ENDPOINT/$PARENT/queuedResources