Quote Cloud TPU

Questo documento elenca le quote che si applicano a Cloud TPU. Per informazioni sui prezzi di Cloud TPU, consulta la pagina Prezzi di Cloud TPU.

Google Cloud utilizza le quote per garantire l'equità e ridurre i picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una Google Cloud risorsa che Google Cloud il progetto può utilizzare. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utenti diGoogle Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano inoltre a gestire le tue Google Cloud risorse.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

Nella maggior parte dei casi, quando provi a utilizzare una risorsa per un volume maggiore di quello consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di progetto Google Cloud. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud, le quote sono condivise tra tutte le applicazioni e gli indirizzi IP.

Quota TPU

Le quote TPU sono dei limiti al numero di core Cloud TPU che puoi utilizzare con un Google Cloud progetto. A ogni versione di TPU è associata una quota. Inoltre, ogni quota della versione Cloud TPU è divisa in quota on demand e quota prerilasciabile (o spot).

Quando crei risorse Cloud TPU, per impostazione predefinita crei risorse on demand. Puoi creare risorse prelevabili utilizzando il parametro --spot quando crei risorse con il comando gcloud. Per ulteriori informazioni, consulta Gestire le risorse TPU.

Quote Cloud TPU predefinite

Le tabelle seguenti mostrano i valori predefiniti per la quota on demand e preassegnata per ogni zona disponibile. Questi valori specificano il numero massimo di core TPU che puoi utilizzare all'interno del tuo progetto.

Versione TPU Quota predefinita (numero di core) Nome quota
v6e 64 core Core TPU v6e prerilasciabili per progetto e per zona
v5p 768 core Core TPU v5p prerilasciabili per progetto e per zona
v5e 64 core Core dei pod TPU v5 Lite prerilasciabili per progetto e per zona
v4 0 core Core dei pod TPU v4 prerilasciabili per progetto e per zona
Pod v3 32 core Core dei pod TPU v3 prerilasciabili per progetto e per zona
v3 120 core Core TPU v3 prerilasciabili per progetto e per zona
Pod v2 32 core Core dei pod TPU v2 prerilasciabili per progetto e per zona
v2 120 core Core TPU v2 prerilasciabili per progetto e per zona
Versione TPU Quota predefinita (numero di core) Nome quota
v6e 32 core Core TPU v6e per progetto e per zona
v5p 128 core Core TPU v5p per progetto e per zona
v5e 32 core Core dei pod TPU v5 Lite per progetto e per zona
v4 0 core Core dei pod TPU v4 per progetto e per zona
Pod v3 32 core Core dei pod TPU v3 per progetto e per zona
v3 40 core Core TPU v3 per progetto e per zona
Pod v2 32 core Core TPU v2 per progetto e per zona
v2 40 core Core dei pod TPU v2 per progetto e per zona

Visualizzare e richiedere una quota aggiuntiva

Puoi visualizzare la quota allocata per il tuo Google Cloud progetto nella pagina Quote della console Google Cloud.

Puoi richiedere una quota aggiuntiva di Cloud TPU dalla pagina Quote. Individua la quota che vuoi aumentare, fai clic sui tre puntini verticali e scegli Modifica quota. Per ulteriori informazioni, consulta Richiedere un limite di quota più alto. Se richiedi una quota inferiore alla soglia di approvazione automatica, la tua richiesta verrà approvata automaticamente.

Versione TPU Soglia di approvazione automatica Nome quota
v6e Tutte le zone: 0 core Core TPU v6e prerilasciabili per progetto e per zona
v5p Tutte le zone: 0 core Core TPU v5p prerilasciabili per progetto e per zona
v5e
  • us-east5-b: 800 core
  • us-west4-a: 1600 core
  • us-west4-b: 3968 core
  • us-west1-c: 576 core
  • us-central1-a: 3264 core
  • europe-west4-a: 4032 core
Core dei pod TPU v5 Lite prerilasciabili per progetto e per zona
v4 Tutte le zone: 0 core Core dei pod TPU v4 prerilasciabili per progetto e per zona
Pod v3
  • europe-west4-a: 512 core
  • us-east1-d: 320 core
Core dei pod TPU v3 prerilasciabili per progetto e per zona
v3
  • us-central1-a: 64 core
  • europe-west4-a: 128 core
Core TPU v3 prerilasciabili per progetto e per zona
Pod v2
  • us-central1-a: 64 core
  • europe-west4-a: 64 core
Core dei pod TPU v2 prerilasciabili per progetto e per zona
v2
  • us-central1-b: 128 core
  • us-central1-c: 64 core
  • us-central1-f: 128 core
  • europe-west4-a: 32 core
Core TPU v2 prerilasciabili per progetto e per zona
Versione TPU Soglia di approvazione automatica Nome quota
v6e Tutte le zone: 0 core Core TPU v6e per progetto e per zona
v5p us-east5-a: 64 core Core TPU v5p per progetto e per zona
v5e Tutte le zone: 64 core Core dei pod TPU v5 Lite per progetto e per zona
v4 Tutte le zone: 0 core Core dei pod TPU v4 per progetto e per zona
Pod v3
  • europe-west4-a: 128 core
  • us-east1-d: 64 core
Core dei pod TPU v3 per progetto e per zona
v3
  • us-central1-a: 64 core
  • europe-west4-a: 128 core
Core TPU v3 per progetto e per zona
Pod v2
  • us-central1-a: 64 core
  • europe-west4-a: 64 core
Core TPU v2 per progetto e per zona
v2
  • us-central1-b: 128 core
  • us-central1-c: 64 core
  • us-central1-f: 128 core
  • europe-west4-a: 32 core
Core dei pod TPU v2 per progetto e per zona

Riceverai un'email che ti comunica se la tua richiesta di quota è stata approvata o rifiutata. Gli aumenti della quota del servizioGoogle Cloud vengono applicati gradualmente. Ciò potrebbe comportare rollout continui in regioni o risorse diverse. Durante l'implementazione, il valore della quota visualizzato nella console Google Cloud o nell'API Cloud Quotas non rifletterà il nuovo valore della quota aumentato fino al completamento dell'implementazione. Per ulteriori informazioni, vedi Visualizzare le implementazioni in corso.