Guida dell'utente sulle risorse in coda
Le risorse in coda consentono di richiedere risorse Cloud TPU in modo in coda. Quando richiedi risorse in coda, la richiesta viene aggiunta a una coda gestita dal servizio Cloud TPU. Quando la risorsa richiesta diventa disponibile, viene assegnata al tuo progetto Google Cloud per l'uso esclusivo immediato. Rimarrà assegnato al tuo progetto a meno che non lo elimini o non venga prerilasciato. Solo le TPU prerilasciabili sono idonee per il prerilascio.
Puoi specificare un'ora di inizio e/o un'ora di fine facoltativa in una richiesta di risorsa in coda. L'ora di inizio specifica la prima data/ora in cui soddisfare la richiesta. Se una richiesta non è stata soddisfatta entro l'ora di fine specificata, scade. La richiesta rimane in coda dopo la scadenza.
Le richieste di risorse in coda possono avere uno dei seguenti stati:
ACCEPTED
-
La richiesta è stata aggiunta alla coda. Rimane in questo stato fino a quando non viene allocato o fino a quando non scade il suo intervallo di allocazione. Lo stato
ACCEPTED
non garantisce che alla richiesta venga allocata una quota. Il passaggio dallo statoACCEPTED
allo statoACTIVE
potrebbe richiedere del tempo. PROVISIONING
- La richiesta è stata selezionata dalla coda e le relative risorse sono attualmente in fase di allocazione.
ACTIVE
- La richiesta è stata allocata. Quando le richieste di risorse in coda sono in stato
ACTIVE
, puoi gestire le VM TPU come descritto in Gestire le TPU. FAILED
- Impossibile completare la richiesta perché si è verificato un problema con la richiesta oppure perché le risorse richieste non erano disponibili nell'intervallo di allocazione. La richiesta rimane in coda fino a quando non viene eliminata in modo esplicito.
SUSPENDING
- Le risorse associate alla richiesta sono attualmente in fase di eliminazione.
SUSPENDED
- Le risorse specificate nella richiesta sono state eliminate. Quando una richiesta è nello stato
SUSPENDED
, non è più idonea per un'ulteriore allocazione.
Prerequisiti
Prima di eseguire i comandi di questa guida, assicurati di:
- Installa i componenti alpha di Google Cloud CLI
- Abilita l'API Cloud TPU
Richiedi una risorsa in coda on demand
Puoi richiedere una risorsa on demand in coda utilizzando il comando gcloud alpha compute tpus queued-resources create
. Per ulteriori informazioni sulle risorse on demand, consulta Tipi di quota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID della TPU assegnato dall'utente che viene creato al momento dell'allocazione della richiesta di risorse in coda.
project
- Il tuo progetto Google Cloud.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
Dimensioni predefinite delle sezioni per le risorse in coda on demand
Quando utilizzi la quota on demand, devi richiedere una dimensione sezione inferiore al limite predefinito per il tipo di acceleratore che stai utilizzando. Le richieste che superano i limiti predefiniti vengono rifiutate dal sistema.
La tabella seguente mostra i tipi di TPU e i relativi limiti predefiniti associati.
Tipo di acceleratore | Limite predefinito (in numero di TensorCore) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
Versione 5 | 32 |
Se hai bisogno di sezioni di dimensioni maggiori, contatta l'assistenza di Cloud TPU per ulteriori informazioni.
Richiedi una risorsa in coda utilizzando la quota riservata
Puoi richiedere una risorsa in coda utilizzando la quota riservata specificando il flag --reserved
nel comando gcloud
oppure guaranteed.reserved=true
nella richiesta curl. Per ulteriori informazioni sulla quota prenotata, consulta Tipi di quota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0 \ --reserved
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID della TPU assegnato dall'utente che viene creato al momento dell'allocazione della richiesta di risorse in coda.
project
- Il tuo progetto Google Cloud.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
reserved
- Utilizza questo flag quando richiedi risorse in coda come parte di una prenotazione di Cloud TPU.
Richiedi una risorsa prerilasciabile in coda
Puoi richiedere una risorsa prerilasciabile in coda. Una risorsa prerilasciabile è una risorsa che può essere assegnata a un altro carico di lavoro se altri carichi di lavoro richiedono risorse aggiuntive. Le risorse prerilasciabili costano meno e puoi ottenere l'accesso alle risorse in tempi più brevi rispetto a una richiesta non prerilasciabile. Per ulteriori informazioni sulla quota prerilasciabile, consulta Tipi di quota.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0 \ --best-effort
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', } } }, 'best_effort': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
best-effort
- Un flag booleano che specifica che la risorsa in coda è prerilasciabile.
Richiedi l'allocazione di una risorsa in coda prima o dopo un determinato periodo di tempo
Puoi specificare un'ora di inizio, un'ora di fine, una durata di inizio o una durata di fine facoltative in una richiesta di risorse in coda. L'ora di inizio o la durata di inizio specifica la prima ora in cui soddisfare la richiesta. Se una richiesta non è stata evasa entro l'ora di fine specificata o entro la durata specificata, scade. Una volta scaduta, la richiesta rimane in coda, ma non è più idonea per l'allocazione.
Puoi anche specificare un intervallo di allocazione specificando un'ora di inizio o una durata e un'ora di fine o la durata.
Consulta Datetime per un elenco dei formati di timestamp e durata supportati.
Richiedi una risorsa in coda dopo una durata specificata
Puoi specificare una durata dopo la quale deve essere allocata una risorsa utilizzando il flag --valid-after-duration
. L'esempio seguente richiede l'allocazione di una versione v4-32 dopo sei ore.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-after-duration 6h
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
valid-after-duration
- La durata entro la quale non deve essere eseguito il provisioning della TPU. Per saperne di più sui formati di durata, consulta Data/ora dell'argomento Google Cloud CLI
Richiedi una risorsa in coda che scada dopo una durata specificata
Puoi specificare per quanto tempo una richiesta di risorse in coda rimane valida utilizzando il flag --valid-until-duration
. L'esempio seguente richiede una versione v4-32 che scade se non viene compilata entro sei ore.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-until-duration 6h
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
valid-until-duration
- Il periodo di validità della richiesta. Per saperne di più sui formati di durata, consulta Data/ora dell'argomento Google Cloud CLI
Richiedi una risorsa in coda dopo un periodo di tempo specificato
Puoi specificare un orario dopo il quale allocare una risorsa utilizzando il flag --valid-after-time
.
Il seguente comando richiede l'allocazione di una TPU v4-4096 con
versione di runtime tpu-vm-tf-2.14.0
dopo le 09:00 del 14 dicembre 2022.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-after-time 2022-12-14T09:00:00Z
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
valid-after-time
- L'ora dopo la quale deve essere allocata la risorsa. Per ulteriori informazioni sui formati di durata, consulta Data/ora dell'argomento Google Cloud CLI.
Richiedi una risorsa in coda prima di un orario specificato
Puoi specificare un orario prima del quale allocare la risorsa utilizzando il flag --valid-until-time
.
Il seguente comando richiede la creazione di un nodo TPU v4-4096 con versione di runtime tpu-vm-tf-2.10.0-pod
entro e non oltre il 14 dicembre 2022 alle 09:00.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-until-time 2022-12-14T09:00:00Z
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
valid-until-time
- Ora dopo il quale la richiesta viene annullata. Per ulteriori informazioni sui formati di durata, consulta Data/ora dell'argomento Google Cloud CLI.
Richiedi l'allocazione di una risorsa in coda entro un intervallo specificato
Puoi specificare un intervallo di allocazione utilizzando qualsiasi coppia dei flag --valid-after-time
, --valid-after-duration
, --valid-until-duration
e --valid-until-time
, a condizione che un flag specifichi l'inizio dell'intervallo di allocazione e l'altro la fine dell'intervallo di allocazione.
Il seguente comando richiede la creazione di una versione v4-32 entro 5 ore e 30 minuti dall'ora corrente entro le ore 09:00 del 14 dicembre 2022.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.14.0-pod \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.14.0-pod', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni flag comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
valid-until-timw
- Ora dopo il quale la richiesta viene annullata. Per ulteriori informazioni sui formati di durata, consulta Data/ora dell'argomento Google Cloud CLI.
valid-until-duration
- Il periodo di validità della richiesta. Per ulteriori informazioni sui formati di durata, consulta Data/ora dell'argomento Google Cloud CLI.
Richiedi una risorsa in coda con uno script di avvio
Puoi specificare uno script da eseguire su una risorsa in coda dopo il provisioning. Quando utilizzi il comando gcloud
, puoi utilizzare il flag --metadata
o --metadata-from-file
per specificare rispettivamente un comando di script o un file contenente il codice dello script. Quando utilizzi curl
, devi includere il codice dello script nei contenuti JSON. L'esempio seguente crea una richiesta di risorse in coda che eseguirà lo script contenuto in startup-script.sh
. L'esempio curl
mostra uno script incorporato nel corpo JSON.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --reserved \ --metadata-from-file='startup-script=startup-script.sh'
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.14.0', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni flag comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
validInterval
- Il periodo di tempo durante il quale la richiesta è valida, trascorso il quale la richiesta viene annullata. Per ulteriori informazioni sui formati di durata, consulta Data/ora dell'argomento Google Cloud CLI.
metadata-from-file
- Specifica un file che contiene metadati. Se non specifichi un percorso completo del file dei metadati, il comando presume che si trovi nella directory attuale. In questo esempio, il file contiene uno script di avvio che viene eseguito quando viene eseguito il provisioning della risorsa in coda.
metadata
- Specifica i metadati della richiesta. In questo esempio i metadati sono un comando di script di avvio eseguito quando viene eseguito il provisioning della risorsa in coda.
Richiedi risorse in coda con una rete e una subnet specificate
Puoi richiedere una risorsa in coda specificando la rete e la subnet a cui vuoi connettere la TPU.
gcloud
gcloud alpha compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.14.0 \ --network network-name \ --subnetwork subnetwork-name
arricciare
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.14.0', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri di comando
queued-resource-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
node-id
- L'ID della TPU assegnato dall'utente che viene creato al momento dell'allocazione della richiesta di risorse in coda.
project
- Il tuo progetto Google Cloud.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di Cloud TPU da creare.
runtime-version
- La versione software di Cloud TPU.
reserved
- Utilizza questo flag quando richiedi risorse in coda come parte di una prenotazione di Cloud TPU.
network
- Una rete di cui farà parte la risorsa in coda.
subnetwork
- Una subnet di cui farà parte la risorsa in coda.
Elimina una richiesta di risorse in coda
Puoi eliminare una richiesta di risorse in coda e la VM TPU creata dalla richiesta
passando il flag --force
al comando queued-resource delete
. In caso contrario, devi eliminare la VM TPU prima di eliminare la richiesta di risorse in coda. Quando elimini la VM TPU, la richiesta di risorsa in coda passa allo stato SUSPENDED
, dopodiché la richiesta di risorse in coda potrebbe essere eliminata.
I comandi seguenti eliminano la richiesta di risorsa in coda denominata "my-queued-resource" nel progetto "my-project" nella zona "us-central2-b". Utilizza il flag --force
per eliminare sia la VM TPU che la richiesta di risorse in coda.
gcloud
gcloud alpha compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
arricciare
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descrizioni flag comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona della Cloud TPU da eliminare.
force
- Elimina sia la VM TPU sia la richiesta di risorse in coda.
I comandi seguenti eliminano la richiesta di risorsa in coda denominata "my-queued-resource" nel progetto "my-project" nella zona "us-central2-b".
gcloud
gcloud alpha compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
arricciare
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrizioni flag comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
Recuperare informazioni sullo stato e sulla diagnostica di una richiesta di risorse in coda
Recupera le informazioni sullo stato e sulla diagnostica relative a una richiesta di risorse in coda:
gcloud
gcloud alpha compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
arricciare
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/ us-central2-b/queuedResources/your-queued-resource-id
Descrizioni flag comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorsa in coda.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
Se la richiesta non va a buon fine, la risposta conterrà informazioni sull'errore. Per una richiesta accettata, l'output sarà simile al seguente:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: ACCEPTED tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Elenca le richieste di risorse in coda nel progetto
Il seguente comando elenca le richieste di risorse in coda nel progetto "your-project-id":
gcloud
gcloud alpha compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
arricciare
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources
Descrizioni flag comando
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.