quote di allocazione

Questo documento elenca le quote di allocazione che si applicano a Compute Engine.

quote di allocazione

Le quote di allocazione, note anche come quote delle risorse, definiscono il numero di risorse a cui ha accesso il progetto. Compute Engine applica quote di allocazione sull'utilizzo delle risorse per vari motivi. Ad esempio, le quote aiutano a proteggere la community di utenti di Google Cloud da picchi di utilizzo imprevisti. Google Cloud offre inoltre quote per la prova gratuita che forniscono un accesso limitato ai progetti per consentirti di esplorare Google Cloud gratuitamente.

Non tutti i progetti hanno le stesse quote. Man mano che utilizzi Google Cloud sempre di più nel tempo, le tue quote potrebbero aumentare di conseguenza. Se prevedi un aumento imminente e consistente dell'utilizzo, puoi richiedere un adeguamento della quota in modo proattivo nella pagina Quote della console Google Cloud.

Per informazioni specifiche sulle quote per i limiti di frequenza per l'API Compute Engine, consulta Quota API.

Quote e disponibilità delle risorse

Le quote di allocazione sono il numero massimo di risorse di un determinato tipo che puoi creare, se disponibili. Le quote non garantiscono che le risorse siano sempre disponibili. Se una risorsa non è disponibile o se la risorsa scelta è esaurita nella regione che hai scelto, non puoi creare nuove risorse di quel tipo, anche se hai ancora a disposizione quota nella regione o nel progetto. Ad esempio, potresti disporre di una quota sufficiente per creare indirizzi IP esterni in us-central1, ma potrebbero non essere disponibili indirizzi IP in questa area geografica.

Analogamente, anche se hai una quota a livello di regione, una risorsa potrebbe non essere disponibile in una zona specifica. Ad esempio, potresti avere a disposizione una quota per creare istanze VM nella regione us-central1, ma potresti non essere in grado di creare istanze VM nella zona us-central1-a se la zona è esaurita. In questi casi, prova a creare la stessa risorsa in un'altra zona, ad esempio us-central1-f. Per saperne di più sulle opzioni a tua disposizione in caso di esaurimento delle risorse a livello di zona, consulta la documentazione per la risoluzione dei problemi di disponibilità delle risorse.

quote di allocazione

Quando pianifichi le tue esigenze di istanza VM, è consigliabile considerare diverse quote che influiscono sul numero di istanze VM che puoi creare.

Quote a livello di area geografica e quote globali

Le quote per le VM vengono gestite a livello di area geografica. Istanza VM, gruppo di istanze, quote per disco e CPU possono essere utilizzati da qualsiasi VM nella regione, indipendentemente dalla zona. Ad esempio, la quota per le CPU è a livello di area geografica, perciò il limite e il conteggio di utilizzo sono diversi per ogni area geografica. Per avviare un'istanza n2-standard-16 in qualsiasi zona dell'area geografica us-central1, avrai bisogno di una quota sufficiente per almeno 16 CPU in us-central1.

Per creare firewall, bilanciatori del carico, reti e VPN vengono richieste quote per networking e bilanciamento del carico. Sono quote globali che non dipendono da una regione. Qualsiasi area geografica può utilizzare una quota globale. Ad esempio, gli indirizzi IP esterni statici e in uso assegnati a bilanciatori del carico e proxy HTTP e HTTPS utilizzano quote globali.

Istanze VM

La quota per le istanze VM è a livello di regione e limita il numero di istanze VM che possono trovarsi in una determinata regione, a prescindere dal fatto che la VM sia in esecuzione. Questa quota è visibile nella pagina Quote della console Google Cloud. Compute Engine imposta automaticamente questa quota in modo che sia dieci volte superiore alla quota CPU normale. Non è necessario richiedere questa quota. Se hai bisogno di aumentare la quota per le istanze VM, richiedi più CPU, perché un numero maggiore di CPU aumenta la quota delle istanze VM. La quota si applica alle VM in esecuzione, a quelle non in esecuzione, nonché alle istanze normali e prerilasciabili.

  1. Nella console Google Cloud, vai alla pagina Quote.

    Vai a Quote

  2. Fai clic su Filtra tabella e seleziona Servizio.

  3. Scegli API Compute Engine.

  4. Scegli Quota: istanze VM.

  5. Per visualizzare un elenco delle quote delle istanze VM per regione, fai clic su Tutte le quote. Le quote della tua area geografica sono elencate dall'utilizzo più alto a quello più basso.

  6. Fare clic sulla casella di controllo dell'area geografica di cui si desidera modificare la quota.

  7. Fai clic su Modifica quote.

  8. Compila il modulo.

  9. Fai clic su Invia richiesta.

Gruppi di istanze

Per utilizzare i gruppi di istanze, devi disporre di una quota disponibile per tutte le risorse utilizzate dal gruppo (ad esempio, la quota di CPU) e di una quota disponibile per la risorsa del gruppo stesso. A seconda del tipo di gruppo che crei, si applicano le seguenti quote di utilizzo delle risorse del gruppo:

Tipo di servizio Quota per servizio
Gruppo di istanze gestite per area geografica (più zone) Regional instance group managers
Gruppo di istanze gestite per zona (una sola zona) Entrambe le opzioni:
  • Instance group managers
  • Instance groups
Gruppo di istanze non gestite (una sola zona) Instance groups
Gestore della scalabilità automatica per area geografica (più zone) Regional autoscalers
Gestore della scalabilità automatica per zona (una sola zona) Autoscalers

Quote per i dischi

Le seguenti quote per Persistent Disk, Hyperdisk e SSD locale si applicano a livello di regione:

  • Local SSD per machine family (GB). Questa quota è la dimensione cumulativa totale dei dischi SSD locali che puoi collegare alle VM in una regione in base al tipo di macchina di ogni VM. L'SSD locale è un disco temporaneo veloce che deve essere utilizzato per job di memorizzazione temporanea, memorizzazione nella cache locale o elaborazione con un'elevata tolleranza di errore, in quanto il disco non è pensato per sopravvivere ai riavvii delle istanze VM.

    I dischi SSD locali vengono venduti in incrementi di 375 GiB o 3 TiB, a seconda del tipo di macchina. È disponibile anche un numero massimo di dischi SSD locali che possono essere collegati a una singola VM, a seconda del tipo di macchina. Il numero massimo di dischi SSD locali e la dimensione di ogni disco SSD locale creano un limite alla quantità totale di capacità dei dischi SSD locali che puoi allocare per una VM. Nell'interfaccia alla gcloud CLI e nell'API, questo limite è indicato come quota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    Per le VM A3 e A2 Ultra, non è necessario richiedere questa quota poiché le unità SSD locali vengono aggiunte automaticamente a queste VM. Tuttavia, dovresti richiedere LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY per le altre VM ottimizzate per l'acceleratore.

  • Persistent disk standard (GB). Questa quota corrisponde alla dimensione totale dei dischi permanenti standard che si possono creare in una regione. Come descritto in Ottimizzazione delle prestazioni dei dischi permanenti, i dischi permanenti standard offrono una riduzione del numero di IOPS e della velocità effettiva rispetto ai dischi permanenti SSD o ai dischi SSD locali. È conveniente se utilizzato come dischi duraturi di grandi dimensioni per l'archiviazione, come dischi di avvio e per processi di scrittura seriale come i log. I dischi permanenti standard sono durevoli e sono disponibili indefinitamente per essere collegati a una VM all'interno della stessa zona. In gcloud CLI e nell'API, questa quota è denominata DISKS_TOTAL_GB. Questa quota si applica anche ai dischi permanenti standard a livello di regione, ma i dischi permanenti a livello di regione consumano il doppio della quantità di quota per GiB a causa dell'esistenza della replica in due zone all'interno di una regione.

  • Persistent disk SSD (GB). Questa quota è la dimensione cumulativa totale dei volumi di dischi permanenti SSD che si possono creare in una regione. I dischi permanenti SSD, come descritto in Prestazioni dell'archiviazione a blocchi, offrono IOPS e velocità effettiva superiori rispetto ai dischi permanenti standard. I dischi permanenti SSD possono essere collegati senza alcun limite a una VM all'interno della stessa zona. In gcloud CLI e nell'API, questa quota è denominata SSD_TOTAL_GB. Questa quota è separata da quella per i dischi SSD locali. Questa quota si applica ai seguenti tipi di disco:

    • Disco permanente SSD a livello di zona e di regione
    • Disco permanente bilanciato a livello di zona e di regione

    I dischi permanenti a livello di regione consumano il doppio della quantità di quota per GiB a causa della replica in due zone all'interno di una regione.

Quote del pool di archiviazione

I pool di archiviazione Hypeperdisk hanno le seguenti quote, misurate in GB (o 1000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): la quantità totale di spazio su disco che puoi prenotare in un pool di archiviazione bilanciato Hyperdisk con provisioning della capacità avanzato. In gcloud CLI e nell'API, questa quota è indicata come (HDB_STORAGE_POOL_TOTAL_ADVANCED_CAPACITY).

  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): la quantità totale di spazio su disco che puoi prenotare in un pool di archiviazione per la velocità effettiva Hyperdisk con provisioning della capacità avanzato. In gcloud CLI e nell'API, questa quota è indicata come (HDT_STORAGE_POOL_TOTAL_ADVANCED_CAPACITY).

Limiti di quota di CPU

La quota per le CPU è il numero totale di CPU virtuali in tutte le istanze VM in un'area geografica. Le quote per le CPU si applicano alle VM in esecuzione e alle prenotazioni delle VM. Questa quota viene utilizzata sia dalle VM predefinite sia dalle VM prerilasciabili.

Per proteggere i sistemi Compute Engine e altri utenti, anche alcuni nuovi account e progetti hanno una quota globale di CPUs (All Regions). Questa quota si applica a tutte le regioni e viene misurata come la somma di tutte le vCPU in tutte le regioni.

Ad esempio, se ti rimangono 48 vCPU in una sola area geografica, come us-central1 ma solo 32 vCPU per la quota CPUs (All Regions), puoi avviare solo 32 vCPU nell'area geografica us-central1, anche se non hai esaurito la quota in quell'area geografica. Il motivo è che hai raggiunto la quota CPU (All Regions) e devi eliminare alcune istanze esistenti prima di poterne avviare di nuove.

I tipi di macchine E2 e N1 condividono un pool di quote per le CPU. Se non diversamente specificato, tutti gli altri tipi di macchine hanno pool di quota di CPU univoci e separati.

Se utilizzi gli sconti per impegno di utilizzo per le tue VM, devi avere una quota di sconto per impegno di utilizzo prima di acquistare un contratto con sconto per impegno di utilizzo.

Tipo di macchina Pool di quota Nome quota CPU Nome quota CPU con impegno
N1 pool condiviso CPUS Committed_CPUS
E2 pool condiviso CPUS Committed_CPUS
N2 pool separato N2_CPUS Committed_N2_CPUS
N4 pool separato CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D pool separato N2D_CPUS Committed_N2D_CPUS
T2D pool separato T2D_CPUS Committed_T2D_CPUS
T2A pool separato T2A_CPUS Non disponibile (N/A) per T2A
Z3 pool separato CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 pool separato M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 pool separato M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 pool separato M3_CPUS Committed_M3_CPUS
H3 pool separato CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 pool separato C2_CPUS Committed_C2_CPUS
C2D pool separato C2D_CPUS Committed_C2D_CPUS
C3 pool separato C3_CPUS Committed_C3_CPUS
C3D pool separato CPUS_PER_VM_FAMILY Committed_C3D_CPUS
A2* pool separato A2_CPUS Committed_A2_CPUS
A3 Non applicabile (N/A) per A3 Non applicabile (N/A) per A3 Non applicabile (N/A) per A3
G2 Non applicabile (N/A) per G2 Non applicabile (N/A) per G2 Non applicabile (N/A) per G2
VM prerilasciabili pool condiviso PREEMPTIBLE_CPUS Non disponibile (N/A) per le VM prerilasciabili

* Per le VM A2, non è necessario richiedere le quote di CPU. Se disponi delle quote GPU necessarie per NVIDIA A100, questa è tutto ciò che serve per creare queste VM.

Per le VM A3 e G2, le quote per le CPU non sono applicabili. Se disponi rispettivamente delle quote GPU NVIDIA H100 e L4 necessarie, questa è l'unica cosa che ti serve per creare queste VM.

Quota per le GPU

Come nel caso della quota per le CPU virtuali, quella per le GPU si riferisce al numero totale di GPU virtuali in tutte le istanze VM di un'area geografica. Le quote per le GPU si applicano alle VM e alle prenotazioni VM in esecuzione. Questa quota viene consumata sia dalle VM predefinite che dalle VM prerilasciabili.

Consulta la pagina Quote per verificare di disporre di un numero sufficiente di GPU nel progetto e per richiedere un aumento della quota. Inoltre, tieni presente che nuovi account e progetti avranno una quota GPU globale valida in tutte le aree geografiche.

Quando richiedi una quota GPU, devi richiedere una quota per i modelli GPU che vuoi creare in ogni regione, oltre a una quota globale aggiuntiva (GPUs (all regions)) per il numero totale di GPU di tutti i tipi in tutte le regioni. Richiedi la quota GPU prerilasciabile per utilizzare queste risorse.

NVIDIA Nome quota GPU Nome quota GPU con impegno Workstation virtuale GPU prerilasciabili Workstation virtuale GPU prerilasciabili
H100 da 80 GB GPUS_PER_GPU_FAMILY COMMITTED_NVIDIA_H100_GPUS N/D PREEMPTIBLE_NVIDIA_H100_GPUS N/D
A100 40GB NVIDIA_A100_GPUS COMMITTED_NVIDIA_A100_GPUS N/D PREEMPTIBLE_NVIDIA_A100_GPUS N/D
A100 80GB NVIDIA_A100_80GB_GPUS COMMITTED_NVIDIA_A100_80GB_GPUS N/D PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N/D
L4 NVIDIA_L4_GPUS COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
T4 NVIDIA_T4_GPUS COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS COMMITTED_NVIDIA_V100_GPUS N/D PREEMPTIBLE_NVIDIA_V100_GPUS N/D
P100 NVIDIA_P100_GPUS COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS
K80 NVIDIA_K80_GPUS COMMITTED_NVIDIA_K80_GPUS N/D PREEMPTIBLE_NVIDIA_K80_GPUS N/D

Quote di allocazione per le risorse prerilasciabili

Per utilizzare CPU o GPU prerilasciabili collegate a istanze VM prerilasciabile o per utilizzare SSD locali collegate a istanze VM prerilasciabile, devi disporre di una quota disponibile nel progetto per le rispettive risorse.

Puoi richiedere quote prerilasciabili speciali per Preemptible CPUs, Preemptible GPUs o Preemptible Local SSDs (GB). Tuttavia, se il progetto non ha una quota prerilasciabile e non hai mai richiesto una quota prerilasciabile, puoi utilizzare la quota standard per avviare le risorse prerilasciabili.

Quando Compute Engine concede la quota prerilasciabile in un'area geografica, tutte le istanze prerilasciabili verranno conteggiate automaticamente all'interno di questa quota. Poiché questa quota è esaurita, devi richiedere una quota prerilasciabile per queste risorse.

Indirizzi IP esterni

Devi avere un numero sufficiente di indirizzi IP esterni per ogni VM che deve essere raggiungibile direttamente dalla rete internet pubblica. La quota di IP a livello di regione è destinata all'assegnazione di indirizzi IPv4 alle VM in quella regione. La quota IP globale consente di assegnare indirizzi IPv4 alle risorse di rete globali, come i bilanciatori del carico. Google Cloud offre vari tipi di indirizzi IP, a seconda delle necessità. Per informazioni sui costi, consulta Prezzi per indirizzi IP esterni. Per informazioni sulle specifiche delle quote, consulta Quote e limiti.

  • Indirizzi IP esterni in uso. Include gli indirizzi IP sia temporanei che statici utilizzati da una risorsa.

  • Indirizzi IP esterni statici: sono indirizzi IP esterni prenotati per le risorse che rimangono attivi anche dopo il riavvio della macchina. Puoi registrare questi indirizzi con servizi di provider di dominio e DNS per fornire un indirizzo riconoscibile dagli utenti, ad esempio www.example-site.com.

  • Indirizzi IP interni statici: gli indirizzi IP interni statici consentono di prenotare indirizzi IP interni dall'intervallo IP interno configurato nella subnet. Puoi assegnare questi indirizzi interni prenotati alle risorse, se necessario.

Implementazioni della quota

A volte, Google Cloud modifica la quota predefinita per risorse e API. Queste modifiche avvengono gradualmente. Durante l'implementazione di una nuova quota predefinita, la quota massima visualizzata nella console Google Cloud potrebbe non riflettere la quota massima effettiva disponibile per te.

Ad esempio, supponiamo che Google Cloud modifichi la quota massima predefinita per le regole firewall da 200 a 300 e che utilizzi la console Google Cloud per visualizzare la quota, potresti vedere la nuova quota di 300, anche se la tua quota effettiva è 200 fino al completamento dell'implementazione.

Per informazioni sulle implementazioni in corso delle quote, consulta i problemi noti. Se non vengono descritti problemi, non sono in corso implementazioni delle quote.

Se è in corso un'implementazione della quota e vuoi verificare la quota massima effettiva disponibile, utilizza Google Cloud CLI per controllarla. Se hai bisogno di una quota superiore a quella a cui hai accesso, invia una richiesta di aumento della quota.

Passaggi successivi