Quote

Questo documento elenca le quote che si applicano a Cloud TPU. Per informazioni sui prezzi di Cloud TPU, consulta la pagina relativa ai prezzi di Cloud TPU.

Una quota limita la quantità di una risorsa Google Cloud condivisa che può essere utilizzata dal progetto Google Cloud, inclusi hardware, software e componenti di rete. Pertanto, le quote fanno parte di un sistema che:

  • Monitora il tuo utilizzo o consumo di prodotti e servizi Google Cloud.
  • Limita il consumo di queste risorse, per motivi che includono la garanzia dell'equità e la riduzione dei picchi di utilizzo.
  • Mantiene configurazioni che applicano automaticamente le limitazioni prescritte.
  • Offre un mezzo per richiedere o modificare la quota.

Nella maggior parte dei casi, quando viene superata una quota, il sistema blocca immediatamente l'accesso alla risorsa Google pertinente e l'attività che stai tentando di eseguire ha esito negativo. Nella maggior parte dei casi, le quote si applicano a ogni progetto Google Cloud e sono condivise tra tutte le applicazioni e gli indirizzi IP che utilizzano il progetto Google Cloud.

Tipi di quota

Se utilizzi GKE, consulta Assicurati di avere una quota sufficiente per ulteriori informazioni sulla quota GKE. Quando utilizzi le quote dell'API Cloud TPU, sono previste quote separate per le risorse Cloud TPU prenotate, on demand e prerilasciabili (incluse le VM spot). La tabella seguente confronta ogni tipo di quota.

Tipo di quota Descrizione Valore predefinito Come effettuare la richiesta Flag per creazione TPU
Prenotati Il numero di risorse Cloud TPU per le quali hai l'accesso garantito. Per accedere alle risorse prenotate, devi avere un contratto di prenotazione. Le risorse riservate sono protette dagli esaurimenti disponibili, ma sono soggette a interruzioni. 0 Per richiedere una quota prenotata, contatta il tuo rappresentante per l'account Google Cloud. Utilizza il flag --reserved.
On demand Il numero di risorse on demand a cui hai accesso. Le risorse on demand non verranno prerilasciate, ma la quota on demand non garantisce che saranno disponibili risorse Cloud TPU sufficienti per soddisfare la tua richiesta. v3-8 e v2-8: 16 TensorCore
Tutti gli altri: 0
Consulta Richiedere una quota aggiuntiva. Nessun flag necessario, selezionato per impostazione predefinita.
Prerilasciabile Il numero di risorse Cloud TPU prerilasciabili a cui hai accesso. Questa quota si applica sia alle TPU prerilasciabili sia alle VM spot TPU. Le risorse prerilasciabili possono essere prerilasciate per fare spazio a job con priorità più elevata. La quota prerilasciabile non garantisce che ci saranno risorse Cloud TPU sufficienti per soddisfare la tua richiesta. Per maggiori informazioni, consulta TPU prerilasciabili e Gestire le VM spot TPU. v3-8 e v2-8: 48 TensorCore
Tutti gli altri: 0
Consulta Richiedere una quota aggiuntiva.

Assegnazione delle quote

La quota di Cloud TPU viene concessa in modo diverso a seconda della versione delle TPU in uso.

TPU v4 e v5p

Per TPU v4 e v5p, la quota può essere specificata in termini di chip TPU o TensorCore. Puoi utilizzare la tua quota con qualsiasi combinazione di sezioni. Ad esempio, se disponi di una quota per una sezione v4-32, puoi utilizzarla per creare quattro sezioni v4-8.

TPU v5e (addestramento e inferenza)

La versione v5e supporta sia l'addestramento sia l'inferenza. Le sezioni v5e utilizzate per l'inferenza includono TPU con tipi di acceleratore v5litepod-1, v5litepod-4 o v5litepod-8. Devi avere tpu-v5s-litepod-serving di quota per le Cloud TPU on demand, tpu-v5s-litepod-serving-preemptible per le VM spot TPU e le Cloud TPU prerilasciabili e di tpu-v5s-litepod-serving-reserved per le Cloud TPU prenotate.

TPU v2 e v3

La quota TPU v2 e v3 è specificata in termini di TensorCore. Un singolo dispositivo TPU contiene quattro chip TPU e otto TensorCore (due TensorCore per chip). Le TPU v2 e v3 hanno quote separate per singoli dispositivi TPU e pod TPU. Non puoi utilizzare la quota di pod di TPU v2 o v3 per le TPU v2-8 o v3-8. Ad esempio, se disponi di una quota per una sezione v3-32, non puoi utilizzarla per creare quattro TPU v3-8.

Per ulteriori informazioni sui chip TPU e sui TensorCore, consulta Architettura del sistema TPU.

Visualizza e richiedi quota aggiuntiva

Puoi visualizzare la quota allocata per il tuo progetto Google Cloud nella pagina Quote della console Google Cloud. Se hai bisogno di un'ulteriore quota di Cloud TPU, puoi richiederla dalla pagina Quote. Per ulteriori informazioni, consulta Richiedere un limite di quota superiore.