Guida dell'utente sulle risorse in coda

Le risorse in coda consentono di richiedere le risorse Cloud TPU in coda. Quando richiedi risorse in coda, la richiesta viene aggiunta a una coda gestita dal servizio Cloud TPU. Quando la risorsa richiesta diventa disponibile, viene assegnata al tuo progetto Google Cloud per un uso esclusivo immediato. Rimarrà assegnato al tuo progetto, a meno che non lo elimini o non venga prerilasciato. Solo le TPU prerilasciabili sono idonee per il prerilascio.

Puoi specificare un'ora di inizio e di fine facoltativa in una richiesta di risorsa in coda. L'ora di inizio specifica la prima ora in cui soddisfare la richiesta. Se una richiesta non è stata soddisfatta entro l'ora di fine specificata, scade. Una volta scaduta, la richiesta rimane in coda.

Le richieste di risorse in coda possono avere uno dei seguenti stati:

WAITING_FOR_RESOURCES
La richiesta ha superato la convalida iniziale ed è stata aggiunta alla coda. Rimane in questo stato finché non sono disponibili risorse gratuite sufficienti per iniziare il provisioning della richiesta o finché non scade l'intervallo di allocazione. Quando la domanda è elevata, non è possibile eseguire immediatamente il provisioning di tutte le richieste. Se hai bisogno di ottenere una soluzione più affidabile per le TPU, valuta la possibilità di acquistare una prenotazione.
PROVISIONING
La richiesta è stata selezionata dalla coda e le relative risorse sono attualmente in fase di allocazione.
ACTIVE
La richiesta è stata allocata. Quando le richieste di risorse in coda sono in stato ACTIVE, puoi gestire le VM TPU come descritto in Gestire le TPU.
FAILED
Impossibile completare la richiesta perché si è verificato un problema con la richiesta oppure perché le risorse richieste non erano disponibili nell'intervallo di allocazione. La richiesta rimane in coda fino a quando non viene eliminata in modo esplicito.
SUSPENDING
Le risorse associate alla richiesta sono attualmente in fase di eliminazione.
SUSPENDED
Le risorse specificate nella richiesta sono state eliminate. Quando una richiesta è nello stato SUSPENDED, non è più idonea per un'ulteriore allocazione.

Prerequisiti

Prima di eseguire i comandi di questa guida, assicurati di:

Richiedi una risorsa in coda on demand

Puoi richiedere una risorsa in coda on demand utilizzando il comando gcloud alpha compute tpus queued-resources create. Per ulteriori informazioni sulle risorse on demand, consulta Tipi di quote.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID assegnato dall'utente della TPU creato al momento dell'allocazione della richiesta di risorsa in coda.
project
Il tuo progetto Google Cloud.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.

Dimensioni delle sezioni predefinite per le risorse in coda on demand

Quando utilizzi la quota on demand, devi richiedere una dimensione di sezione inferiore al limite predefinito per il tipo di acceleratore in uso. Le richieste che superano i limiti predefiniti vengono rifiutate dal sistema.

La seguente tabella mostra i tipi di TPU e i relativi limiti predefiniti associati.

Tipo di acceleratore Limite predefinito (in numero di TensorCore)
v2 128
v3 128
v4 384
v5 32

Se hai bisogno di sezioni più grandi, contatta l'assistenza di Cloud TPU per ulteriori informazioni.

Richiedi una risorsa in coda utilizzando la quota riservata

Puoi richiedere una risorsa in coda utilizzando la quota riservata specificando il flag --reserved nel comando gcloud oppure guaranteed.reserved=true nella richiesta curl. Per ulteriori informazioni sulla quota prenotata, consulta Tipi di quote.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--reserved

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID assegnato dall'utente della TPU creato al momento dell'allocazione della richiesta di risorsa in coda.
project
Il tuo progetto Google Cloud.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
reserved
Utilizza questo flag quando richiedi risorse in coda come parte di una prenotazione di Cloud TPU.

Richiedi una risorsa in coda prerilasciabile

Puoi richiedere una risorsa in coda prerilasciabile. Una risorsa prerilasciabile è una risorsa che può essere assegnata a un altro carico di lavoro se altri carichi di lavoro richiedono risorse aggiuntive. Le risorse prerilasciabili hanno un costo inferiore e potresti ottenere l'accesso alle risorse in tempi più brevi rispetto a una richiesta non prerilasciabile. Per ulteriori informazioni sulla quota prerilasciabile, consulta Tipi di quote.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--best-effort

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
    }
  }
},
'best_effort': {}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
L'ID del progetto in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
best-effort
Un flag booleano che specifica che la risorsa in coda è prerilasciabile.

Richiedi l'allocazione di una risorsa in coda prima o dopo un periodo di tempo specificato

Puoi specificare un'ora di inizio, un'ora di fine, una durata di inizio o una durata di fine facoltativa in una richiesta di risorsa in coda. L'ora di inizio o la durata di inizio specifica la prima data in cui soddisfare la richiesta. Se una richiesta non viene soddisfatta entro l'ora di fine specificata o entro la durata specificata, scade. Dopo la scadenza, la richiesta rimane in coda ma non è più idonea per l'allocazione.

Puoi anche specificare un intervallo di allocazione specificando un'ora di inizio o una durata e un'ora o una durata di fine.

Consulta Datetime per un elenco dei formati di timestamp e durata supportati.

Richiedi una risorsa in coda dopo una durata specificata

Puoi specificare una durata dopo la quale allocare una risorsa utilizzando il flag --valid-after-duration. L'esempio seguente richiede l'allocazione di una versione 4-32 dopo sei ore.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 6h

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
valid-after-duration
La durata prima della quale non deve essere eseguito il provisioning della TPU. Per maggiori informazioni sui formati della durata, consulta Data/ora dell'argomento Google Cloud CLI

Richiedi una risorsa in coda che scada dopo una durata specificata

Puoi specificare per quanto tempo una richiesta di risorse in coda rimane valida utilizzando il flag --valid-until-duration. L'esempio seguente richiede una versione 4-32 che scade se non viene compilata entro sei ore.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-duration 6h

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_duration': {
    'seconds': 21600
  }
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
valid-until-duration
La durata di validità della richiesta. Per maggiori informazioni sui formati della durata, consulta Data/ora dell'argomento Google Cloud CLI

Richiedi una risorsa in coda dopo un intervallo di tempo specificato

Puoi specificare un intervallo di tempo dopo il quale deve essere allocata una risorsa utilizzando il flag --valid-after-time.

Il seguente comando richiede l'allocazione di una TPU v4-4096 con versione di runtime tpu-vm-tf-2.16.1-pjrt dopo le 09:00 del 14 dicembre 2022.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-time 2022-12-14T09:00:00Z

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_after_time': {
    'seconds': 2022-12-14T09:00:00Z
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
valid-after-time
L'ora dopo la quale deve essere allocata la risorsa. Per ulteriori informazioni sui formati della durata, consulta Data/ora dell'argomento Google Cloud CLI.

Richiedi una risorsa in coda prima di un orario specificato

Puoi specificare un orario prima della quale deve essere allocata la risorsa utilizzando il flag --valid-until-time.

Il seguente comando richiede la creazione di un nodo TPU v4-4096 con versione di runtime tpu-vm-tf-2.10.0-pod entro il 14 dicembre 2022 alle 09:00.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-4096 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-until-time 2022-12-14T09:00:00Z

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-4096',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'valid_until_time': {
    'seconds': 1655197200
  }
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
L'ID del progetto in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
valid-until-time
Ora dopo il quale la richiesta viene annullata. Per ulteriori informazioni sui formati della durata, consulta Data/ora dell'argomento Google Cloud CLI.

Richiedi l'allocazione di una risorsa in coda entro un intervallo specificato

Puoi specificare un intervallo di allocazione utilizzando qualsiasi coppia dei flag --valid-after-time, --valid-after-duration, --valid-until-duration e --valid-until-time, a condizione che un flag specifichi l'inizio dell'intervallo di allocazione e l'altro la fine dell'intervallo.

Il seguente comando richiede che la versione v4-32 venga creata entro cinque ore e 30 minuti dall'ora corrente entro il 14 dicembre 2022 alle 09:00.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project-id \
--zone us-central2-b \
--accelerator-type v4-32 \
--runtime-version tpu-vm-tf-2.16.1-pod-pjrt \
--valid-after-duration 5h30m \
--valid-until-time 2022-12-14T09:00:00Z

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-32',
      'runtime_version': 'tpu-vm-tf-2.16.1-pod-pjrt',
    }
  }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni flag comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
L'ID del progetto in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
valid-until-timw
Ora dopo il quale la richiesta viene annullata. Per ulteriori informazioni sui formati della durata, consulta Data/ora dell'argomento Google Cloud CLI.
valid-until-duration
La durata di validità della richiesta. Per ulteriori informazioni sui formati della durata, consulta Data/ora dell'argomento Google Cloud CLI.

Richiedere una risorsa in coda con uno script di avvio

Puoi specificare uno script da eseguire su una risorsa in coda dopo che è stato eseguito il provisioning. Quando utilizzi il comando gcloud, puoi utilizzare il flag --metadata o --metadata-from-file per specificare rispettivamente un comando di script o un file contenente il codice dello script. Quando utilizzi curl, devi includere il codice dello script nei contenuti JSON. L'esempio seguente crea una richiesta di risorse in coda che eseguirà lo script contenuto in startup-script.sh. L'esempio curl mostra uno script incorporato nel corpo JSON.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.12.0 \
--reserved \
--metadata-from-file='startup-script=startup-script.sh'

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
tpu: {
    node_spec: {
      parent: 'projects/your-project-number/locations/us-central2-b',
      node_id: 'your-node-id',
      node: {
          accelerator_type: 'v2-8',
          runtime_version: 'tpu-vm-tf-2.16.1-pjrt',
          metadata: {
              "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt"
          }
      }
    }
},
'queueing_policy': {
  'validInterval': {
    'startTime': '2022-12-10T14:30:00Z',
    'endTime': '2022-12-14T09:00:00Z'
  }
},
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni flag comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID definito dall'utente della TPU creata in risposta alla richiesta.
project
L'ID del progetto in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
validInterval
Il periodo di tempo durante il quale la richiesta è valida dopo il quale viene annullata. Per maggiori informazioni sui formati della durata, consulta Data/ora dell'argomento Google Cloud CLI.
metadata-from-file
Specifica un file che contiene metadati. Se non specifichi un percorso completo del file di metadati, il comando presuppone che si trovi nella directory attuale. In questo esempio, il file contiene uno script di avvio che viene eseguito quando viene eseguito il provisioning della risorsa in coda.
metadata
Specifica i metadati della richiesta. In questo esempio, i metadati sono un comando di script di avvio eseguito quando viene eseguito il provisioning della risorsa in coda.

Richiedi risorse in coda con una rete e una subnet specificate

Puoi richiedere una risorsa in coda specificando la rete e la subnet a cui vuoi connettere la TPU.

gcloud

gcloud alpha compute tpus queued-resources create your-queued-resource-id \
--node-id your-node-id \
--project your-project \
--zone us-central2-b \
--accelerator-type v4-8 \
--runtime-version tpu-vm-tf-2.16.1-pjrt \
--network network-name \
--subnetwork subnetwork-name

arricciatura

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d "{
'tpu': {
  'node_spec': {
    'parent': 'projects/your-project-number/locations/us-central2-b',
    'node_id': 'your-node-id',
    'node': {
      'accelerator_type': 'v4-8',
      'runtime_version': 'tpu-vm-tf-2.16.1-pjrt',
       'network_config': {
        'network': 'network-name',
        'subnetwork': 'subnetwork-name',
        'enable_external_ips': true
    }
  }
},
'guaranteed': {
  'reserved': true,
}
}" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources?queued_resource_id=your-queued-resource-id

Descrizioni dei parametri di comando

queued-resource-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
node-id
L'ID assegnato dall'utente della TPU creato al momento dell'allocazione della richiesta di risorsa in coda.
project
Il tuo progetto Google Cloud.
zone
La zona in cui prevedi di creare la Cloud TPU.
accelerator-type
Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che vuoi creare. Per maggiori informazioni sui tipi di acceleratori supportati per ogni versione di TPU, consulta Versioni TPU.
runtime-version
La versione del software Cloud TPU.
reserved
Utilizza questo flag quando richiedi risorse in coda come parte di una prenotazione di Cloud TPU.
network
Una rete di cui farà parte la risorsa in coda.
subnetwork
Una subnet di cui farà parte la risorsa in coda.

Elimina una richiesta di risorse in coda

Puoi eliminare una richiesta di risorse in coda e la VM TPU creata dalla richiesta passando il flag --force al comando queued-resource delete. In caso contrario, devi eliminare la VM TPU prima di eliminare la richiesta di risorsa in coda. Quando elimini la VM TPU, la richiesta di risorsa in coda passa allo stato SUSPENDED, dopodiché la richiesta di risorse in coda potrebbe essere eliminata.

I comandi seguenti eliminano la richiesta di risorsa in coda denominata "my-queued-resource" nel progetto "my-project" nella zona "us-central2-b". Utilizza il flag --force per eliminare sia la VM TPU che la richiesta di risorse in coda.

gcloud

gcloud alpha compute tpus queued-resources delete my-queued-resource \
--project my-project \
--zone us-central2-b \
--force \
--async

arricciatura

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/my-project/locations/us-central2-b/queuedResources/my-queued-resource?force=true

Descrizioni flag comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
project
Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
La zona della Cloud TPU da eliminare.
force
Elimina sia la VM TPU sia la richiesta di risorse in coda.

I comandi seguenti eliminano la richiesta di risorsa in coda denominata "my-queued-resource" nel progetto "my-project" nella zona "us-central2-b".

gcloud

gcloud alpha compute tpus queued-resources delete your-queued-resource-id \
--project your-project-id \
--zone us-central2-b

arricciatura

curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descrizioni flag comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
project
Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.

Recuperare informazioni su stato e diagnostica di una richiesta di risorse in coda

Recupera lo stato e le informazioni diagnostiche su una richiesta di risorse in coda:

gcloud

gcloud alpha compute tpus queued-resources describe queued-resource-request-id \
--project your-project-id \
--zone us-central2-b

arricciatura

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id

Descrizioni flag comando

queued-resource-request-id
L'ID della richiesta di risorse in coda assegnato dall'utente.
project
L'ID del progetto in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.

Se la richiesta non va a buon fine, la risposta conterrà informazioni sull'errore. Per una richiesta in attesa di risorse, l'output sarà simile al seguente:

name: projects/your-project-id/locations/us-central2-b/queuedResources/your-queued-resource-id
state:
  state: WAITING_FOR_RESOURCES
tpu:
  nodeSpec:
  - node:
      acceleratorType: v4-8
      bootDisk: {}
      networkConfig:
        enableExternalIps: true
      queuedResource: projects/your-project-number/locations/us-central2-b/queuedResources/your-queued-resource-id
      runtimeVersion: tpu-vm-tf-2.10.0
      schedulingConfig: {}
      serviceAccount: {}
      shieldedInstanceConfig: {}
      useTpuVm: true
    nodeId: your-node-id
    parent: projects/your-project-number/locations/us-central2-b

Elenca le richieste di risorse in coda nel tuo progetto

Il seguente comando elenca le richieste di risorse in coda nel progetto "your-project-id":

gcloud

gcloud alpha compute tpus queued-resources list --project your-project-id \
--zone us-central2-b

arricciatura

curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central2-b/queuedResources

Descrizioni flag comando

project
Il progetto Google Cloud in cui è allocata la risorsa in coda.
zone
La zona in cui prevedi di creare la Cloud TPU.