Quote Cloud TPU

Questo documento elenca le quote che si applicano a Cloud TPU. Per informazioni sui prezzi di Cloud TPU, consulta la pagina Prezzi di Cloud TPU.

Google Cloud utilizza le quote per contribuire a garantire l'equità e ridurre gli picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una risorsa Google Cloud che può essere utilizzata nel progetto Google Cloud. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utenti di Google Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano anche a gestire le tue risorse Google Cloud.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

  • Monitora il tuo consumo di prodotti e servizi Google Cloud
  • Limita il consumo di queste risorse
  • Fornisce un modo per richiedere modifiche al valore della quota

Nella maggior parte dei casi, quando provi a consumare più di una risorsa rispetto a quanto consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di progetto Google Cloud. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud, le quote sono condivise tra tutte le applicazioni e gli indirizzi IP.

Quota TPU

Esistono quote diverse per ogni versione di TPU. Ad esempio, esistono diverse quote per TPU v2, v3 e così via. Per ogni versione di TPU esistono diversi tipi di quote: on-demand e preassegnate (VM spot). La tabella seguente descrive i diversi tipi di quota.

Tipo di quota Descrizione Valore predefinito Come effettuare la richiesta Flag per la creazione di TPU
On demand Il numero di risorse on demand a cui hai accesso. Le risorse on-demand non verranno prese in preempizione, ma la quota on-demand non garantisce che ci siano risorse Cloud TPU disponibili sufficienti per soddisfare la tua richiesta. v3-8 e v2-8: 16 TensorCore
Tutti gli altri: 0
Consulta Richiedi quota aggiuntiva. Nessun flag necessario, selezionato per impostazione predefinita.
Prerilasciabile Il numero di risorse Cloud TPU preassegnate a cui hai accesso. Questa quota si applica sia alle TPU prerilasciabili sia alle VM TPU spot. Le risorse preassegnabili possono essere preassegnate per fare spazio a job con priorità più elevata. La quota preassegnata non garantisce che saranno disponibili risorse Cloud TPU sufficienti per soddisfare la tua richiesta. Per ulteriori informazioni, consulta TPU prerilasciabili e Gestire le VM spot TPU. v3-8 e v2-8: 48 Tensor Core
Tutti gli altri: 0
Consulta Richiedi quota aggiuntiva.

Le quote TPU sono specificate in termini di core TPU per progetto e per zona o core TPU per progetto e per regione.

Quote TPU v5p

Puoi utilizzare la quota TPU v5p in qualsiasi combinazione di core. Ad esempio, se hai una quota per 32 core, puoi utilizzarla per creare quattro slice TPU ciascuno con 8 core.

Quote preemptible:

  • Core TPU v5p prerilasciabili per progetto e per regione
  • Core TPU v5p prerilasciabili per progetto e per zona

Quote on demand:

  • Core TPU v5p per progetto e per regione
  • Core TPU v5p per progetto e per zona

Quote TPU v5e

TPU v5e può essere utilizzata per l'addestramento e la pubblicazione. Esistono quote separate per la formazione e la pubblicazione, nonché per i singoli host (core lite) e i multi-host (core del pod lite).

Quote di pubblicazione

Quote di pubblicazione preemptible:

  • Core dei pod TPU v5 lite prerilasciabili per il servizio per progetto e per regione
  • Core dei pod TPU v5 lite prerilasciabili per il servizio per progetto e per zona

Quote di pubblicazione on demand:

  • Core dei pod TPU v5 lite per il servizio per progetto e per regione
  • Core dei pod TPU v5 lite per il servizio per progetto e per zona

Quote di formazione

Quote di addestramento preemptible:

  • Core TPU v5 lite prerilasciabili per progetto e per regione
  • Core TPU v5 lite prerilasciabili per progetto e per zona
  • Core dei pod TPU v5 lite prerilasciabili per progetto e per regione
  • Core dei pod TPU v5 Lite prerilasciabili per progetto e per zona

Quote per la formazione on demand:

  • Core TPU v5 lite per progetto e per regione
  • Core TPU v5 lite per progetto e per zona
  • Core del pod TPU v5 Lite per progetto e per regione
  • Core dei pod TPU v5 Lite per progetto e per zona

Quote TPU v4

Puoi utilizzare la quota TPU v4 in qualsiasi combinazione di core. Ad esempio, se hai una quota per 32 core, puoi utilizzarla per creare quattro slice TPU ciascuno con 8 core.

Quote preemptible:

  • Core dei pod TPU v4 prerilasciabili per progetto e per regione
  • Core dei pod TPU v4 prerilasciabili per progetto e per zona

Quote on demand:

  • Core dei pod TPU v4 per progetto e per regione
  • Core dei pod TPU v4 per progetto e per zona

Quote TPU v3

Esistono quote TPU v3 separate per TPU a singolo host (core) e TPU a più host (pod). Devi utilizzare le quote dei pod v3 per creare TPU con più di 8 core.

Quote preemptible:

  • Core TPU v3 prerilasciabili per progetto e per area geografica
  • Core TPU v3 prerilasciabili per progetto e per zona
  • Core dei pod TPU v3 prerilasciabili per progetto e per regione
  • Core dei pod TPU v3 prerilasciabili per progetto e per zona

Quote on demand:

  • Core TPU v3 per progetto e per area geografica
  • Core TPU v3 per progetto e per zona
  • Core dei pod TPU v3 per progetto e per regione
  • Core dei pod TPU v3 per progetto e per zona

Quote TPU v2

Esistono quote TPU v2 separate per TPU a singolo host (core) e TPU a più host (pod).

Quote preemptible:

  • Core TPU v2 prerilasciabili per progetto e per area geografica
  • Core TPU v2 prerilasciabili per progetto e per zona
  • Core dei pod TPU v2 prerilasciabili per progetto e per regione
  • Core dei pod TPU v2 prerilasciabili per progetto e per zona

Quote on demand:

  • Core TPU v2 per progetto e per area geografica
  • Core TPU v2 per progetto e per zona
  • Core dei pod TPU v2 per progetto e per regione
  • Core dei pod TPU v2 per progetto e per zona

Per ulteriori informazioni sui chip TPU e sui Tensor Core, consulta la sezione Architettura di sistema TPU.

Visualizzare e richiedere una quota aggiuntiva

Puoi visualizzare la quota allocata per il tuo progetto Google Cloud nella pagina Quote in Google Cloud Console. Se hai bisogno di un'ulteriore quota di Cloud TPU, puoi richiederla nella pagina Quote. Per ulteriori informazioni, consulta Richiedere un limite di quota più alto.

Quando un servizio Google Cloud aumenta i valori predefiniti delle quote per le risorse e le API, queste modifiche vengono applicate gradualmente. Ciò potrebbe comportare implementazioni continue in regioni o risorse diverse. Durante l'implementazione, il valore della quota visualizzato nella console Google Cloud o nell'API Cloud Quotas non rifletterà il nuovo valore della quota aumentato fino al completamento dell'implementazione. Per ulteriori informazioni, consulta la sezione Visualizzare le implementazioni in corso.