configura l'ambiente Cloud TPU
Prima di poter utilizzare le risorse Cloud TPU per addestrare o eseguire l'inferenza sui modelli, devi svolgere i seguenti passaggi di configurazione:
- Configura il progetto Google Cloud
- Configura l'ambiente per l'utilizzo di Cloud TPU
- Prepararsi a richiedere una Cloud TPU
Configura il progetto Google Cloud
Per utilizzare Cloud TPU, devi avere un account e un progetto Google Cloud.
Nella console Google Cloud, accedi al tuo Account Google oppure registrare un nuovo account.
Installa Google Cloud CLI. Google Cloud CLI è interfaccia per l'accesso e la gestione di risorse e servizi Google Cloud.
Seleziona o crea un progetto Google Cloud:
Nella console Google Cloud, seleziona o crea un progetto Cloud dal selettore di progetti.
In Cloud Shell, imposta l'ID progetto utilizzando gcloud CLI. L'ID progetto è il nome del progetto visualizzato nella console Google Cloud.
$ gcloud config set project PROJECT-ID
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
La configurazione della fatturazione è obbligatoria per tutto l'utilizzo di Google Cloud. Ti verrà addebitato solo l'importo dopo aver iniziato a utilizzare le risorse Google Cloud. Per ulteriori informazioni, vedi consulta la documentazione sulla fatturazione Cloud.
La fatturazione per l'utilizzo di tutte le versioni di Cloud TPU segue i prezzi regionali standard riportati nella pagina dei prezzi di Cloud TPU.
Configura l'ambiente per l'utilizzo di Cloud TPU
Prima di richiedere una Cloud TPU, devi attivare l'API Cloud TPU e assicurarti di disporre delle autorizzazioni per gestire l'accesso nel tuo progetto e creare una Cloud TPU. Ti consigliamo inoltre di creare un servizio gestito dall'utente da collegare alla TPU.
Attiva l'API Cloud TPU dalla console Google Cloud o utilizzando gcloud CLI in Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Console
- Nella console Google Cloud, vai alla pagina dell'API Cloud TPU.
Vai alla pagina dell'API Cloud TPU
- Fai clic su Attiva.
Assicurati di disporre dei seguenti ruoli nel progetto:
- Amministratore account di servizio: necessaria per creare un account di servizio
- Amministratore IAM progetto: necessario per concedere un ruolo in un progetto
- Amministratore TPU: necessaria per creare una TPU
Segui le istruzioni riportate in Visualizzare l'accesso corrente per visualizzare chi ha accesso al tuo progetto, alla tua cartella o alla tua organizzazione. Per visualizzare la tua Individua la riga contenente il tuo indirizzo email nella colonna Entità. Se il tuo indirizzo email non è presente in questa colonna, significa che non disponi di alcun ruolo. Nella colonna Ruolo della riga con il tuo indirizzo email, controlla se l'elenco dei ruoli include i ruoli richiesti.
Se non hai un ruolo obbligatorio, concedi il ruolo o chiedi di farlo a un amministratore.
Crea un agente di servizio Cloud TPU:
Gli agenti di servizio, un tipo di identità di servizio, sono identità di servizio gestite da Google che vengono utilizzate dal servizio Cloud TPU per eseguire operazioni nel tuo progetto Google Cloud. Ad esempio, l'agente di servizio viene utilizzato per creare e gestire le risorse Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
Crea un account di servizio TPU:
Gli account di servizio fungono da credenziali per le VM TPU. Ruoli associati a un l'account di servizio concede l'accesso alle risorse Google Cloud. Ti consigliamo di utilizzare una account di servizio dall'utente, concedendo solo le autorizzazioni richieste VM TPU. Quando utilizzi un account di servizio gestito dall'utente, devi specificarlo quando crei una VM TPU utilizzando il flag
--service-account
.Segui le istruzioni riportate in Creare account di servizio per creare un account di servizio gestito dall'utente.
Segui le istruzioni riportate in Gestisci l'accesso a progetti, cartelle e organizzazioni per concedere all'account servizio l'accesso ai servizi Google Cloud a cui accederà la TPU. I seguenti ruoli sono consigliati per consentire alla TPU di accedere ai servizi Google Cloud di uso comune.
- Amministratore TPU: necessario per l'accesso completo alle risorse TPU
- Storage Admin: necessaria per accedere a Cloud Storage
- Writer log: necessario per scrivere log con l'API Logging
- Monitoring Metric Writer: necessario per scrivere le metriche in Cloud Monitoring
Preparativi per la creazione di una Cloud TPU
Prima di creare una Cloud TPU, devi richiedere una quota. Dovresti anche valutare la possibilità di utilizzare le risorse in coda, nonché i parametri da utilizzare per configurare la TPU.
Richiedi quota:
Per creare una Cloud TPU, il progetto Google Cloud deve avere una quota per la versione e le dimensioni della TPU che vuoi creare e per la zona in cui vuoi crearla. Ad esempio, se vuoi creare una TPU v4-8 in
us-central2-b
, richiedi una quota di 8 core TPU v4 inus-central2-b
. Per maggiori informazioni sulle zone in cui è disponibile Cloud TPU, consulta Regioni e zone TPU.La quota viene allocata in modo diverso a seconda della versione della TPU. I diversi tipi di quote hanno aspettative di disponibilità diverse. Per ulteriori informazioni allocazione delle quote, tipi di quota e come richiederne una, consulta Quote.
Decidi se utilizzare le risorse in coda.
La creazione di una Cloud TPU come risorsa in coda è una best practice. Le risorse in coda ti consentono di ricevere la capacità non appena diventa disponibile. Puoi specificare un'ora di inizio e di fine facoltativa per il completamento della richiesta.
Esistono diversi comandi gcloud CLI per lavorare con le risorse in coda. Per ulteriori informazioni, consulta la Guida dell'utente alle risorse in coda.
Determina i parametri di creazione di Cloud TPU:
Zona: imposta il flag
--zone
sulla zona in cui vuoi creare una TPU. Devi allocare una quota in questa zona. Per ulteriori informazioni, consulta Regioni e zone TPU.Configurazione TPU: se non devi specificare una topologia personalizzata o se utilizzi TPU v2 o v3, imposta il flag
--accelerator-type
suvVERSION-TENSORCORES
. Sostituisci VERSION con il numero di versione della TPU che vuoi utilizzare. Sostituisci TENSORCORES con il numero di TensorCore che vuoi utilizzare.Se vuoi personalizzare la topologia fisica della tua TPU, utilizza la Flag
--version
e--topology
. Imposta il flag--version
sulla TPU che vuoi utilizzare. Imposta il flag--topology
sulla topologia che vuoi usare.Per ulteriori informazioni sulle configurazioni TPU, incluse quelle supportate configurazioni e varianti di topologia, consulta Versioni TPU.
Versione software: se richiedi una risorsa in coda, imposta il flag
--runtime-version
sul nome della versione software che vuoi utilizzare. In caso contrario, usa il flag--version
. Versioni software TPU sono disponibili per i framework TensorFlow, PyTorch e JAX. Per maggiori informazioni sulle versioni software supportate, consulta Versioni software delle VM TPU.Account di servizio: imposta
--service-account
sull'indirizzo email di un servizio se ne hai creato uno, per collegare l'account di servizio alla tua TPU. Se vuoto, l'account di servizio Compute Engine predefinito .Tipo di quota: aggiungi il flag corrispondente al tipo di quota desiderato per utilizzare:
Tipo di quota Bandiera Prenotato --reserved
VM spot --spot
Prerilasciabile (non disponibile per le risorse in coda; utilizza --spot
)--preemptible
On demand Non è necessario alcun flag aggiuntivo Configurazione avanzata: puoi aggiungere altri flag alla richiesta per configurare la TPU. Consulta la documentazione di
gcloud compute tpus tpu-vm create
e nelle sezioni seguenti per ulteriori informazioni:
Per esempi su come creare una Cloud TPU, consulta la sezione Guida introduttiva.
Passaggi successivi
- Scopri come creare e gestire le risorse VM e TPU
- Esegui una guida rapida di Cloud TPU