Configura l'ambiente Cloud TPU
Prima di poter utilizzare le risorse Cloud TPU per addestrare o eseguire l'inferenza sui modelli, devi svolgere i seguenti passaggi di configurazione:
- Configura il progetto Google Cloud
- Configurare l'ambiente per utilizzare Cloud TPU
- Prepararsi a richiedere una Cloud TPU
Configurare il progetto Google Cloud
Per utilizzare Cloud TPU, devi disporre di un account e di un progetto Google Cloud.
Nella console Google Cloud, accedi al tuo Account Google o crea un nuovo account.
Installa Google Cloud CLI. Google Cloud CLI è un'interfaccia per accedere e gestire le risorse e i servizi Google Cloud.
Seleziona o crea un progetto Google Cloud:
Nella console Google Cloud, seleziona o crea un progetto Cloud dal selettore dei progetti.
In Cloud Shell, imposta l'ID progetto utilizzando gcloud CLI. L'ID progetto è il nome del progetto visualizzato nella console Google Cloud.
$ gcloud config set project PROJECT-ID
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
La configurazione della fatturazione è obbligatoria per tutto l'utilizzo di Google Cloud. Ti verranno addebitati costi solo dopo che avrai iniziato a utilizzare le risorse Google Cloud. Per ulteriori informazioni, consulta la documentazione relativa alla fatturazione Cloud.
La fatturazione per l'utilizzo di tutte le versioni di Cloud TPU segue i prezzi regionali standard riportati nella pagina dei prezzi di Cloud TPU.
Configura l'ambiente per l'utilizzo di Cloud TPU
Prima di richiedere una Cloud TPU, devi attivare l'API Cloud TPU e assicurarti di disporre delle autorizzazioni per gestire l'accesso nel tuo progetto e creare una Cloud TPU. Ti consigliamo inoltre di creare un account di servizio gestito dall'utente da collegare alla tua TPU.
Attiva l'API Cloud TPU dalla console Google Cloud o utilizzando la gcloud CLI in Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Console
- Nella console Google Cloud, vai alla pagina dell'API Cloud TPU.
Vai alla pagina dell'API Cloud TPU
- Fai clic su Attiva.
Assicurati di disporre dei seguenti ruoli nel progetto:
- Amministratore account di servizio: necessaria per creare un account di servizio
- Amministratore IAM progetto: necessario per concedere un ruolo in un progetto
- TPU Admin: necessario per creare una TPU
Segui le istruzioni riportate in Visualizzare l'accesso corrente per visualizzare chi ha accesso al tuo progetto, alla tua cartella o alla tua organizzazione. Per visualizzare il tuo accesso, nella colonna Principale individua la riga contenente il tuo indirizzo email. Se il tuo indirizzo email non è presente in questa colonna, significa che non hai alcun ruolo. Nella colonna Ruolo della riga con il tuo indirizzo email, controlla se l'elenco dei ruoli include i ruoli richiesti.
Se non disponi del ruolo richiesto, concedilo o chiedi a un amministratore di farlo.
Crea un agente di servizio Cloud TPU:
Gli agenti di servizio, un tipo di identità di servizio, sono identità di servizio gestite da Google che vengono utilizzate dal servizio Cloud TPU per eseguire operazioni nel tuo progetto Google Cloud. Ad esempio, l'agente di servizio viene utilizzato per creare e gestire le risorse Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
Crea un account di servizio TPU:
Gli account di servizio fungono da credenziali per le VM TPU. I ruoli associati a un account di servizio consentono di accedere alle risorse Google Cloud. Ti consigliamo di utilizzare un account di servizio gestito dall'utente, concedendo solo le autorizzazioni richieste dalla VM TPU. Quando utilizzi un account di servizio gestito dall'utente, devi specificarlo quando crei una VM TPU utilizzando il flag
--service-account
.Segui le istruzioni riportate in Creare account di servizio per creare un account di servizio gestito dall'utente.
Segui le istruzioni riportate in Gestire l'accesso a progetti, cartelle e organizzazioni per concedere al tuo account servizio l'accesso ai servizi Google Cloud a cui accederà la TPU. I seguenti ruoli sono consigliati per consentire alla TPU di accedere ai servizi Google Cloud di uso comune.
- Amministratore TPU: necessario per l'accesso completo alle risorse TPU
- Amministratore Storage: necessario per accedere a Cloud Storage
- Writer log: necessario per scrivere log con l'API Logging
- Monitoring Metric Writer: necessario per scrivere le metriche in Cloud Monitoring
Preparativi per la creazione di una Cloud TPU
Prima di creare una Cloud TPU, devi richiedere una quota. Ti consigliamo inoltre di utilizzare le risorse in coda e di scegliere i parametri da utilizzare per configurare la TPU.
Richiedi quota:
Per creare una Cloud TPU, il progetto Google Cloud deve disporre della quota per la versione e le dimensioni della TPU che vuoi creare e per la zona in cui vuoi crearla. Ad esempio, se vuoi creare una TPU v4-8 in
us-central2-b
, dovresti richiedere una quota di 8 core TPU v4 inus-central2-b
. Per ulteriori informazioni sulle zone in cui è disponibile Cloud TPU, consulta Regioni e zone di TPU.La quota viene allocata in modo diverso a seconda della versione della TPU. I diversi tipi di quote hanno aspettative di disponibilità diverse. Per ulteriori informazioni sull'allocazione delle quote, sui tipi di quote e su come richiederle, consulta la sezione Quote.
Decidi se utilizzare le risorse in coda.
La creazione di una Cloud TPU come risorsa in coda è una best practice. Le risorse in coda ti consentono di ricevere la capacità non appena diventa disponibile. Puoi specificare un'ora di inizio e di fine facoltative per indicare quando deve essere compilata la richiesta.
Esistono diversi comandi gcloud CLI per lavorare con le risorse in coda. Per ulteriori informazioni, consulta la Guida dell'utente alle risorse in coda.
Determina i parametri di creazione di Cloud TPU:
Zona: imposta il flag
--zone
sulla zona in cui vuoi creare una TPU. Devi avere una quota allocata in questa zona. Per ulteriori informazioni, consulta Regioni e zone TPU.Configurazione TPU: se non devi specificare una topologia personalizzata o se utilizzi TPU v2 o v3, imposta il flag
--accelerator-type
suvVERSION-TENSORCORES
. Sostituisci VERSION con il numero di versione della TPU che vuoi utilizzare. Sostituisci TENSORCORES con il numero di TensorCore che vuoi utilizzare.Se vuoi personalizzare la topologia fisica della TPU, utilizza i flag
--version
e--topology
. Imposta il flag--version
sulla versione della TPU che vuoi utilizzare. Imposta il flag--topology
sulla topologia che vuoi utilizzare.Per ulteriori informazioni sulle configurazioni TPU, tra cui le configurazioni e le varianti di topologia supportate, consulta la sezione Versioni TPU.
Versione software: se richiedi una risorsa in coda, imposta il flag
--runtime-version
sul nome della versione software che vuoi utilizzare. In caso contrario, utilizza il flag--version
. Le versioni software TPU sono disponibili per i framework TensorFlow, PyTorch e JAX. Per maggiori informazioni sulle versioni software supportate, consulta Versioni software delle VM TPU.Account di servizio: imposta
--service-account
sull'indirizzo email di un account di servizio, se ne hai creato uno, per collegarlo alla TPU. Se il campo è vuoto, verrà utilizzato l'account di servizio Compute Engine predefinito.Tipo di quota: aggiungi l'indicatore corrispondente al tipo di quota che vuoi utilizzare:
Tipo di quota Bandiera Prenotato --reserved
VM spot --spot
Prenotabile (non disponibile per le risorse in coda; utilizza --spot
)--preemptible
On demand Non è necessario alcun flag aggiuntivo Configurazione avanzata: puoi aggiungere altri flag alla richiesta per configurare la TPU. Per ulteriori informazioni, consulta la documentazione di
gcloud compute tpus tpu-vm create
e le seguenti sezioni:
Per esempi su come creare una Cloud TPU, consulta la sezione Guida introduttiva.
Passaggi successivi
- Scopri come creare e gestire le risorse VM e TPU
- Esegui una guida rapida di Cloud TPU