Guida dell'utente alle risorse in coda
Le risorse in coda ti consentono di richiedere risorse Cloud TPU mettendole in coda. Quando richiedi le risorse in coda, la richiesta viene aggiunta a una coda gestita dal servizio Cloud TPU. Quando la risorsa richiesta diventa disponibile, viene assegnata al tuo progetto Google Cloud per il tuo uso esclusivo immediato. Rimarrà assegnati al tuo progetto, a meno che non lo elimini o non venga prerilasciato. Solo Le VM spot TPU e le TPU prerilasciabili sono idonee per il prerilascio.
Puoi specificare un'ora di inizio e di fine facoltativa in una richiesta di risorse in coda. L'ora di inizio specifica il primo orario in cui compilare la richiesta. Se una richiesta non è stata soddisfatta entro l'ora di fine specificata, scade. La richiesta rimane in coda dopo la scadenza.
Le richieste di risorse in coda possono trovarsi in uno dei seguenti stati:
WAITING_FOR_RESOURCES
- La richiesta ha superato la convalida iniziale ed è stata aggiunta alla coda. Rimane in questo stato finché non sono disponibili risorse libere sufficienti per iniziare il provisioning della richiesta o non scade l'intervallo di allocazione. Quando la domanda è elevata, non è possibile eseguire il provisioning immediato di tutte le richieste. Se hai bisogno di ottenere le TPU in modo più affidabile, valuta l'acquisto di una prenotazione.
PROVISIONING
- La richiesta è stata selezionata dalla coda e le relative risorse sono in fase di allocazione.
ACTIVE
- La richiesta è stata allocata. Quando le richieste di risorse in coda si trovano
ACTIVE
, puoi gestire le VM TPU come descritto in Gestisci le TPU. FAILED
- Non è stato possibile completare la richiesta perché si è verificato un problema con la richiesta o le risorse richieste non erano disponibili nell'intervallo di allocazione. La richiesta rimane in coda finché non viene eliminata esplicitamente.
SUSPENDING
- Le risorse associate alla richiesta vengono eliminate.
SUSPENDED
- Le risorse specificate nella richiesta sono state eliminate. Quando una richiesta è nello stato
SUSPENDED
, non è più idonea per un'ulteriore allocazione.
Prerequisiti
Prima di eseguire i comandi in questa guida, assicurati di:
- Installa i componenti alpha di Google Cloud CLI
- Abilita l'API Cloud TPU
Richiedi una risorsa in coda on demand
Puoi richiedere una risorsa in coda on demand utilizzando il comando gcloud compute tpus queued-resources create
. Per ulteriori informazioni
di risorse on demand, consulta Tipi di quota.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID assegnato dall'utente della TPU che viene creato quando viene allocata la richiesta di risorsa in coda.
project
- Il tuo progetto Google Cloud.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, vedi Versioni TPU.
runtime-version
- La versione del software Cloud TPU.
Dimensioni delle sezioni predefinite per le risorse in coda on demand
Quando utilizzi la quota on demand, devi richiedere una dimensione della sezione inferiore a limite predefinito per il tipo di acceleratore in uso. Richieste che superano le i limiti predefiniti vengono rifiutati dal sistema.
La tabella seguente mostra i tipi di TPU e i relativi tipi limiti predefiniti.
Tipo di acceleratore | Limite predefinito (in numero di TensorCore) |
v2 | 128 |
v3 | 128 |
v4 | 384 |
v5 | 32 |
Se hai bisogno di dimensioni dei segmenti più grandi, contatta l'assistenza Cloud TPU per ulteriori informazioni.
Richiedere una risorsa in coda utilizzando una prenotazione
Puoi richiedere una risorsa in coda utilizzando una prenotazione specificando
--reserved
nel comando gcloud
o guaranteed.reserved=true
nel
curl. Per acquistare una prenotazione, contatta il team dedicato all'account Google Cloud.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --reserved
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID assegnato dall'utente della TPU che viene creato quando viene allocata la richiesta di risorsa in coda.
project
- Il tuo progetto Google Cloud.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, vedi Versioni TPU.
runtime-version
- La versione del software di Cloud TPU.
reserved
- Utilizza questo flag quando richiedi risorse in coda come parte di una Cloud TPU prenotazione.
Richiedi una risorsa in coda per VM spot TPU
Una VM spot è una risorsa che può essere prerilasciata e assegnata a un altro carico di lavoro in qualsiasi momento. Le risorse VM spot costano meno e potresti ottenere l'accesso alle risorse prima rispetto a una richiesta di VM non spot. Per ulteriori informazioni sulle VM spot TPU, consulta Gestire le VM spot TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --spot
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, vedi Versioni TPU.
runtime-version
- La versione del software Cloud TPU.
spot
- Un flag booleano che specifica che la risorsa in coda è una VM spot.
Richiedi l'allocazione di una risorsa in coda prima o dopo un intervallo di tempo specificato
Puoi specificare un'ora di inizio, un'ora di fine, una durata iniziale o una durata finale facoltative in una richiesta di risorse in coda. L'ora di inizio o la durata di inizio specifica l'ora più antica in cui soddisfare la richiesta. Se una richiesta non viene soddisfatta entro l'ora di fine o la durata specificata, scade. Una volta scaduta, la richiesta rimane in coda, ma non è più idonea per l'allocazione.
Puoi anche specificare un intervallo di allocazione indicando un'ora di inizio o una durata e un'ora di fine o una durata.
Consulta Datatime per un elenco dei formati di timestamp e durata supportati.
Richiedi una risorsa in coda dopo una durata specificata
Puoi specificare un periodo di tempo dopo la quale deve essere allocata una risorsa utilizzando
il flag --valid-after-duration
. L'esempio seguente richiede l'allocazione di una v4-32 dopo sei ore.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni di TPU.
runtime-version
- La versione del software Cloud TPU.
valid-after-duration
- La durata prima della quale non deve essere eseguito il provisioning della TPU. Per ulteriori informazioni sui formati della durata, consulta l'argomento Datatime di Google Cloud CLI
Richiedi una risorsa in coda che scade dopo una durata specifica
Puoi specificare per quanto tempo una richiesta di risorse in coda rimane valida utilizzando
il flag --valid-until-duration
. L'esempio seguente richiede una versione v4-32 che
scade se non viene compilato entro sei ore.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-duration 6h
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni di TPU.
runtime-version
- La versione del software Cloud TPU.
valid-until-duration
- La durata di validità della richiesta. Per maggiori informazioni sui formati di durata, consulta la pagina Data/ora dell'argomento Google Cloud CLI
Richiedi una risorsa in coda dopo un orario specificato
Puoi specificare un orario dopo il quale deve essere allocata una risorsa utilizzando
--valid-after-time
flag.
Il seguente comando richiede l'allocazione di una TPU v4-4096 con la versione runtime tpu-vm-tf-2.17.0-pjrt
dopo le ore 09:00 del 14 dicembre 2022.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni di TPU.
runtime-version
- La versione del software di Cloud TPU.
valid-after-time
- Ora dopo la quale la risorsa deve essere allocata. Per ulteriori informazioni sui formati di durata, consulta la sezione Data/ora dell'argomento Google Cloud CLI.
Richiedere una risorsa in coda prima di un'ora specificata
Puoi specificare un'ora entro la quale deve essere allocata la risorsa utilizzando il metodo
--valid-until-time
flag.
Il comando seguente richiede la creazione di una TPU v4-4096 con la versione del runtime tpu-vm-tf-2.10.0-pod
entro le ore 09:00 del 14 dicembre 2022.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-4096 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-4096', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni di TPU.
runtime-version
- La versione del software Cloud TPU.
valid-until-time
- L'ora dopo il quale la richiesta viene annullata. Per ulteriori informazioni sui formati della durata, consulta l'argomento datetime della CLI Google Cloud.
Richiedi l'allocazione di una risorsa in coda entro un intervallo specificato
Puoi specificare un intervallo di allocazione utilizzando qualsiasi coppia di valori --valid-after-time
,
Flag --valid-after-duration
, --valid-until-duration
e --valid-until-time
,
fornito un flag specifica l'inizio dell'intervallo di allocazione e
"Altro" specifica la fine dell'intervallo di allocazione.
Il seguente comando richiede una versione v4-32 entro 5 ore e 30 minuti dall' attuale, da creare entro e non oltre le ore 09:00 del 14 dicembre 2022.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central2-b \ --accelerator-type v4-32 \ --runtime-version tpu-vm-tf-2.17.0-pod-pjrt \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-32', 'runtime_version': 'tpu-vm-tf-2.17.0-pod-pjrt', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni flag di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, vedi Versioni TPU.
runtime-version
- La versione del software di Cloud TPU.
valid-until-timw
- L'ora dopo il quale la richiesta viene annullata. Per ulteriori informazioni sui formati della durata, consulta l'argomento datetime della CLI Google Cloud.
valid-until-duration
- La durata di validità della richiesta. Per ulteriori informazioni sui formati di durata, consulta la pagina Data/ora dell'argomento Google Cloud CLI.
Richiedere una risorsa in coda con uno script di avvio
Puoi specificare uno script da eseguire su una risorsa in coda dopo
di cui è stato eseguito il provisioning. Quando utilizzi il comando gcloud
, puoi utilizzare il flag --metadata
o --metadata-from-file
per specificare rispettivamente un comando dello script o un file contenente il codice dello script. Quando utilizzi curl
, devi includere il codice
script nei contenuti JSON. L'esempio seguente crea una risorsa in coda
che eseguirà lo script contenuto in startup-script.sh
. curl
un esempio mostra uno script incorporato nel corpo JSON.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.12.0 \ --metadata-from-file='startup-script=startup-script.sh'
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central2-b', node_id: 'your-node-id', node: { accelerator_type: 'v2-8', runtime_version: 'tpu-vm-tf-2.17.0-pjrt', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni flag di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni di TPU.
runtime-version
- La versione del software Cloud TPU.
validInterval
- L'ora entro la quale la richiesta è valida, dopodiché viene annullata. Per ulteriori informazioni sui formati della durata, consulta l'argomento datetime della CLI Google Cloud.
metadata-from-file
- Specifica un file che contiene metadati. Se non specifichi un parametro percorso qualificato del file di metadati, il comando presuppone che si trovi nel percorso della directory corrente. In questo esempio, il file contiene uno script di avvio che viene eseguito al momento del provisioning della risorsa in coda.
metadata
- Specifica i metadati per la richiesta. In questo esempio, i metadati sono un comando dello script di avvio eseguito quando viene eseguito il provisioning della risorsa in coda.
Richiedere una risorsa in coda con una rete e una subnet specificate
Puoi richiedere una risorsa in coda specificando la rete e la subnet a cui vuoi connettere la TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project \ --zone us-central2-b \ --accelerator-type v4-8 \ --runtime-version tpu-vm-tf-2.17.0-pjrt \ --network network-name \ --subnetwork subnetwork-name
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central2-b', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v4-8', 'runtime_version': 'tpu-vm-tf-2.17.0-pjrt', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id
Descrizioni dei parametri dei comandi
queued-resource-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
node-id
- L'ID assegnato dall'utente della TPU che viene creato quando viene allocata la richiesta di risorsa in coda.
project
- Il tuo progetto Google Cloud.
zone
- La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per ulteriori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni di TPU.
runtime-version
- La versione del software Cloud TPU.
reserved
- Utilizza questo flag quando richiedi risorse in coda come parte di una Cloud TPU prenotazione.
network
- Una rete a cui la risorsa in coda farà parte.
subnetwork
- Una subnet di cui farà parte la risorsa in coda.
Eliminare una richiesta di risorsa in coda
Puoi eliminare una richiesta di risorse in coda e la VM TPU creata dalla richiesta
passando il flag --force
al comando queued-resource delete
. Altrimenti,
devi eliminare la VM TPU prima di eliminare la richiesta di risorse in coda. Quando elimini la VM TPU, la richiesta di risorsa in coda passa allo stato SUSPENDED
, dopodiché la richiesta di risorsa in coda può essere eliminata.
I comandi seguenti eliminano la richiesta di risorse in coda denominata
"my-queued-resource" nel file "mio-progetto" progetto nella zona "us-central2-b". it
usa il flag --force
per eliminare sia la VM TPU sia la risorsa in coda
richiesta.
gcloud
gcloud compute tpus queued-resources delete my-queued-resource \ --project my-project \ --zone us-central2-b \ --force \ --async
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true
Descrizioni flag di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona della Cloud TPU da eliminare.
force
- Elimina sia la VM TPU sia la richiesta di risorse in coda.
I seguenti comandi eliminano la richiesta di risorsa in coda denominata "my-queued-resource" nel progetto "my-project" nella zona "us-central2-b".
gcloud
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrizioni flag di comando
queued-resource-request-id
- L'ID assegnato dall'utente della richiesta di risorse in coda.
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
Recuperare informazioni sullo stato e sulla diagnostica su una richiesta di risorse in coda
Recupera le informazioni sullo stato e sulla diagnostica di una richiesta di risorse in coda:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
Descrizioni flag di comando
queued-resource-request-id
- L'ID assegnato dall'utente alla richiesta di risorsa in coda.
project
- L'ID del progetto in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.
Se la richiesta non va a buon fine, la risposta conterrà informazioni sull'errore. Per una richiesta in attesa di risorse, l'output sarà simile al seguente:
name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id runtimeVersion: tpu-vm-tf-2.10.0 schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central2-b
Elenca le richieste di risorse in coda nel tuo progetto
Il comando seguente elenca le richieste di risorse in coda nel progetto "your-project-id":
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central2-b
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central2-b/queuedResources
Descrizioni flag di comando
project
- Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
- La zona in cui prevedi di creare la Cloud TPU.