quote di allocazione


Questo documento elenca le quote di allocazione che si applicano a Compute Engine.

quote di allocazione

Le quote di allocazione, note anche come quote di risorse, definiscono il numero di risorse a cui ha accesso il tuo progetto. Compute Engine applica quote di allocazione sull'utilizzo delle risorse per vari motivi. Ad esempio, le quote contribuiscono a proteggere la community di utenti di Google Cloud da picchi di utilizzo imprevisti. Google Cloud offre inoltre quote per la prova gratuita che forniscono un accesso limitato ai progetti per consentirti di esplorare Google Cloud gratuitamente.

Non tutti i progetti hanno le stesse quote. Man mano che utilizzi sempre più Google Cloud nel tempo, le tue quote potrebbero aumentare di conseguenza. Se prevedi un aumento imminente e consistente dell'utilizzo, puoi richiedere un adeguamento della quota in modo proattivo nella pagina Quote della console Google Cloud.

Per informazioni specifiche sulle quote per i limiti di frequenza per l'API Compute Engine, consulta Quota API.

Quote e disponibilità delle risorse

Le quote di allocazione rappresentano il numero massimo di risorse di un determinato tipo che puoi creare, se disponibili. Le quote non garantiscono che le risorse siano sempre disponibili. Se una risorsa non è disponibile o se la risorsa desiderata è esaurita nell'area geografica che hai scelto, non potrai creare nuove risorse del tipo scelto, anche se hai ancora a disposizione parte della quota nell'area geografica o nel progetto. Ad esempio, potresti disporre di una quota sufficiente per creare indirizzi IP esterni in us-central1, ma potrebbero non essere disponibili indirizzi IP in questa area geografica.

Allo stesso modo, anche se disponi di una quota a livello di area geografica, è possibile che una risorsa non sia disponibile in una determinata zona. Ad esempio, potresti avere una quota per creare istanze VM nella regione us-central1, ma potresti non essere in grado di creare istanze VM nella zona us-central1-a se la specifica risorsa è esaurita in tale zona. In questi casi, prova a creare la stessa risorsa in un'altra zona, ad esempio us-central1-f. Per scoprire di più sulle opzioni a tua disposizione in caso di esaurimento delle risorse in un'area specifica, consulta la documentazione sulla risoluzione dei problemi relativi alla disponibilità delle risorse.

quote di allocazione

Al momento di pianificare le esigenze per un'istanza VM, devi prendere in considerazione diverse quote che riguardano il numero di istanze VM che puoi creare.

Quote a livello di area geografica e quote globali

Le quote per le VM vengono gestite a livello di area geografica. Le quote per istanze VM, gruppi di istanze, dischi e CPU possono essere utilizzate da qualsiasi VM nella regione, indipendentemente dalla zona. Ad esempio, la quota per le CPU è a livello di area geografica, perciò il limite e il conteggio di utilizzo sono diversi per ogni area geografica. Per avviare un'istanza n2-standard-16 in qualsiasi zona dell'area geografica us-central1, avrai bisogno di una quota sufficiente per almeno 16 CPU in us-central1.

Per creare firewall, bilanciatori del carico, reti e VPN vengono richieste quote per networking e bilanciamento del carico. Queste quote sono globali e non dipendono da una regione. Qualsiasi area geografica può utilizzare una quota globale. Ad esempio, gli indirizzi IP esterni in uso e statici assegnati ai bilanciatori del carico e ai proxy HTTP e HTTPS utilizzano quote globali.

Istanze VM

La quota per le istanze VM è a livello di area geografica e limita il numero di istanze VM che possono trovarsi in una determinata area geografica, indipendentemente dal fatto che la VM sia in esecuzione o meno. Questa quota è visibile nella console Google Cloud nella pagina Quote. Compute Engine imposta automaticamente questa quota in modo che sia 10 volte superiore alla quota normale per le CPU. Non è necessario richiedere questa quota. Se hai bisogno di aumentare la quota per altre istanze VM, richiedi più CPU, perché un numero maggiore di CPU determina un aumento di questa quota per le istanze VM. La quota si applica alle VM in esecuzione, a quelle non in esecuzione, nonché alle istanze normali e prerilasciabili.

  1. Nella console Google Cloud, vai alla pagina Quote.

    Vai a Quote

  2. Nell'elenco Filtro, seleziona le seguenti opzioni:

    • Per Servizio, seleziona API Compute Engine.
    • In Tipo, seleziona Quota.
    • In Nome, seleziona Istanze VM.
    • (Facoltativo) Per Metrica, seleziona un altro nome quota CPU o CPU con impegno da filtrare.
  3. (Facoltativo) Per ordinare la tabella per regione, fai clic sulla colonna Dimensioni (ad es. località).

  4. Seleziona le regioni di cui vuoi modificare la quota.

  5. Fai clic su Modifica.

  6. Compila il modulo.

  7. Fai clic su Invia richiesta.

Gruppi di istanze

Per utilizzare i gruppi di istanze, devi avere una quota disponibile per tutte le risorse che il gruppo utilizza (ad esempio per le CPU), più una quota disponibile per la risorsa "gruppo". In base al tipo di gruppo che crei, per le risorse del gruppo si applicano le seguenti quote di utilizzo:

Tipo di servizio Quota per servizio
Gruppo di istanze gestite per area geografica (più zone) Regional instance group managers
Gruppo di istanze gestite per zona (una sola zona) Entrambe le opzioni:
  • Instance group managers
  • Instance groups
Gruppo di istanze non gestite (una sola zona) Instance groups
Gestore della scalabilità automatica per area geografica (più zone) Regional autoscalers
Gestore della scalabilità automatica per zona (una sola zona) Autoscalers

Quote per i dischi

Le seguenti quote per Persistent Disk, Hyperdisk e SSD locali si applicano a seconda dell'area geografica:

  • Hyperdisk Balanced Capacity (GB). Questa quota corrisponde alla dimensione cumulativa totale dei dischi Hyperdisk bilanciato che puoi creare in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata come HDB-TOTAL-GB.
  • Hyperdisk Balanced Throughput (MB/s). Questa quota corrisponde alla quantità totale di throughput che puoi eseguire il provisioning per tutti i dischi Hyperdisk bilanciati in una zona. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata come HDB-TOTAL-THROUGHPUT.
  • Hyperdisk Balanced IOPS. Questa quota corrisponde alla quantità totale di IOPS che puoi eseguire il provisioning per tutti i dischi Hyperdisk bilanciati in una zona. In gcloud CLI e nell'API, questa quota è indicata come HDB-TOTAL-IOPS.
  • Hyperdisk ML Capacity (GB). Questa quota corrisponde alla dimensione cumulativa totale dei dischi Hyperdisk ML che puoi creare in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata come HDML-TOTAL-GB.
  • Hyperdisk ML Throughput (MB/s). Questa quota è l'importo totale del throughput che puoi eseguire il provisioning per tutti i dischi Hyperdisk ML in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata come HDML-TOTAL-THROUGHPUT.
  • Persistent disk standard (GB). Questa quota corrisponde alla dimensione totale dei dischi permanenti standard che si possono creare in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata come DISKS_TOTAL_GB. Questa quota si applica anche a:
    • Dischi permanenti standard a livello di area geografica, ma i dischi permanenti a livello di area geografica consumano il doppio della quantità di quota per GiB a causa dell'esistenza di repliche dei dischi in due zone all'interno della stessa area geografica.
    • Quando scegli di conservare i dati dell'SSD locale quando arresti o sospendi una VM, viene consumata una quantità equivalente di quota del disco permanente standard.
  • Persistent disk SSD (GB). Questa quota corrisponde alla dimensione cumulativa totale dei volumi dei dischi permanenti basati su SSD che si possono creare in una regione. Nella gcloud CLI e nell'API, questa quota è indicata come SSD_TOTAL_GB. Questa quota è separata dalla quota per i dischi SSD locali. Questa quota si applica ai seguenti tipi di dischi:

    • Disco permanente SSD a livello di zona e di regione
    • Disco permanente bilanciato a livello di zona e di regione

    I dischi permanenti a livello di area geografica consumano il doppio della quantità di quota per GiB a causa dell'esistenza di repliche dei dischi in due zone all'interno della stessa area geografica.

  • Persistent Disk IOPS. Questa quota corrisponde al numero totale di operazioni I/O al secondo per i volumi Extreme Persistent Disk che possono essere creati in una regione. Nella gcloud CLI e nell'API, questa quota è indicata come PD-EXTREME-TOTAL-PROVISIONED-IOPS. Questa quota è separata dalla quota IOPS per Google Cloud Hyperdisk.

  • Local SSD per machine family (GB). Questa quota corrisponde alla dimensione cumulativa totale dei dischi SSD locali che puoi collegare alle VM in una regione in base al tipo di macchina di ciascuna VM. L'unità SSD locale è un disco temporaneo veloce che va utilizzato per job di memorizzazione temporanea, inserimento nella cache locale o elaborazione con tolleranza elevata di errori, dato che il disco non è destinato a rimanere attivo quando le istanze VM vengono riavviate.

    I dischi SSD locali vengono venduti in incrementi di 375 GiB o 3 TiB, a seconda del tipo di macchina. Esiste inoltre un numero massimo di dischi SSD locali che possono essere collegati a una singola VM, a seconda del tipo di macchina. Il numero massimo di dischi SSD locali e le dimensioni di ciascun disco SSD locale creano un limite alla quantità totale di capacità del disco SSD locale che puoi allocare per una VM. In gcloud CLI e nell'API, questo limite è indicato come quota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    Per le VM A3 e A2 Ultra, non è necessario richiedere questa quota, poiché le SSD locali vengono aggiunte automaticamente a queste VM. Tuttavia, dovrai richiedere LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY per le altre VM ottimizzate per l'acceleratore.

Quote del pool di archiviazione

Per la capacità, i pool di archiviazione Hyperdisk con provisioning della capacità avanzata hanno le seguenti quote, misurate in GB (o 1000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): la quantità totale di spazio su disco che puoi prenotare per regione in un pool di archiviazione Hyperdisk bilanciato con provisioning della capacità avanzato.

    • Gcloud CLI e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Metrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): la quantità totale di spazio su disco che puoi prenotare per regione in un pool di archiviazione Hyperdisk Throughput con provisioning della capacità avanzato.

    • Gcloud CLI e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Metrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

Per le prestazioni, i pool di archiviazione Hyperdisk con provisioning avanzato delle prestazioni hanno le seguenti quote:

  • Hyperdisk Balanced Storage Pools Advanced IOPS: le IOPS totali che puoi prenotare in un pool di archiviazione Hyperdisk bilanciato con provisioning delle prestazioni avanzate per una regione.

    • Gcloud CLI e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Metrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): il throughput totale che puoi prenotare in un pool di archiviazione bilanciato Hyperdisk con provisioning delle prestazioni avanzato per una regione.

    • Gcloud CLI e API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Metrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): il throughput totale che puoi prenotare in un pool dello spazio di archiviazione Hyperdisk Throughput con provisioning delle prestazioni avanzato per una regione.

    • Gcloud CLI e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Metrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Limiti di quota CPU

La quota per le CPU è il numero totale di CPU virtuali in tutte le istanze VM in un'area geografica. Le quote per le CPU si applicano alle VM in esecuzione e alle prenotazioni di VM. Questa quota viene utilizzata sia dalle VM prerilasciabili sia da quelle predefinite.

Per contribuire a proteggere i sistemi Compute Engine e altri utenti, alcuni nuovi account e progetti dispongono anche di una quota CPUs (All Regions) globale. Questa quota si applica a tutte le regioni e viene misurata come somma di tutte le vCPU in tutte le regioni.

Ad esempio, se ti rimangono 48 vCPU in una sola area geografica, come us-central1 ma solo 32 vCPU per la quota CPUs (All Regions), puoi avviare solo 32 vCPU nell'area geografica us-central1, anche se non hai esaurito la quota in quell'area geografica. Il motivo è che raggiungerai la quota CPU (All Regions) e dovrai eliminare alcune istanze esistenti per poterne avviare di nuove.

I tipi di macchine E2 e N1 condividono un pool di quote per le CPU. Se non diversamente specificato, tutti gli altri tipi di macchine hanno pool di quote per le CPU univoci separati.

Se utilizzi gli sconti per impegno di utilizzo per le tue VM, devi avere una quota di sconto per impegno di utilizzo prima di acquistare un contratto di sconto per impegno di utilizzo.

Tipo di macchina Pool di quote Nome quota CPU Nome quota CPU con impegno
N1 pool condiviso CPUS Committed_CPUS
E2 pool condiviso CPUS Committed_CPUS
N2 pool separato N2_CPUS Committed_N2_CPUS
N4 pool separato CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D pool separato N2D_CPUS Committed_N2D_CPUS
T2D pool separato T2D_CPUS Committed_T2D_CPUS
T2A pool separato T2A_CPUS Non disponibile (N/A) per T2A
Z3 pool separato CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 pool separato M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 pool separato M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 pool separato M3_CPUS Committed_M3_CPUS
X4 pool separato CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 pool separato CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 pool separato C2_CPUS Committed_C2_CPUS
C2D pool separato C2D_CPUS Committed_C2D_CPUS
C3 pool separato C3_CPUS Committed_C3_CPUS
C3D pool separato CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 pool separato CPUS_PER_VM_FAMILY Committed_C4_CPUS
C4A pool separato CPUS_PER_VM_FAMILY Committed_C4A_CPUS
A2* pool separato A2_CPUS Committed_A2_CPUS
A3 Non applicabile (N/A) per A3 Non applicabile (N/A) per A3 Non applicabile (N/A) per A3
G2 Non applicabile (N/A) per G2 Non applicabile (N/A) per G2 Non applicabile (N/A) per G2
VM prerilasciabili pool condiviso PREEMPTIBLE_CPUS Non disponibile (N/A) per le VM preemptibili

*Per le VM A2, non è necessario richiedere quote CPU. Se disponi delle quote GPU NVIDIA A100 richieste, non è necessario altro per creare queste VM.

Per le VM A3 e G2, le quote CPU non sono applicabili. Se disponi delle quote GPU NVIDIA H100 e L4 richieste, non è necessario altro per creare queste VM.

Quota per le GPU

Come nel caso della quota per le CPU virtuali, quella per le GPU si riferisce al numero totale di GPU virtuali in tutte le istanze VM di un'area geografica. Le quote GPU si applicano alle VM in esecuzione e alle prenotazioni VM. Questa quota viene utilizzata sia dalle VM predefinite sia da quelle prerilasciabili.

Consulta la pagina Quote per assicurarti di disporre di un numero sufficiente di GPU nel progetto e per richiedere un aumento della quota. Inoltre, tieni presente che nuovi account e progetti avranno una quota GPU globale valida in tutte le aree geografiche.

Quando richiedi una quota GPU, devi richiedere una quota per i modelli di GPU che vuoi creare in ciascuna regione, oltre a una quota globale aggiuntiva (GPUs (all regions)) per il numero totale di GPU di tutti i tipi in tutte le regioni. Richiedi una quota GPU preassegnata per utilizzare queste risorse.

Tipo di macchina Tipo di GPU Nome quota GPU Famiglia di GPU Nome quota GPU con impegno Workstation virtuale GPU prerilasciabili Workstation virtuale GPU prerilasciabili
A3 Mega H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS N/D PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS N/D
A3 Edge e A3 High H100 80GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS N/D PREEMPTIBLE_NVIDIA_H100_GPUS N/D
A2 Ultra A100 80 GB NVIDIA_A100_80GB_GPUS N/D COMMITTED_NVIDIA_A100_80GB_GPUS N/A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N/D
A2 Standard A100 40 GB NVIDIA_A100_GPUS N/D COMMITTED_NVIDIA_A100_GPUS N/A PREEMPTIBLE_NVIDIA_A100_GPUS N/D
G2 L4 NVIDIA_L4_GPUS N/D COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS N/D COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS N/D COMMITTED_NVIDIA_V100_GPUS N/A PREEMPTIBLE_NVIDIA_V100_GPUS N/D
P100 NVIDIA_P100_GPUS N/D COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS N/D COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Quote preemptible

Puoi richiedere quote prerilasciabili per Preemptible CPUs, Preemptible GPUs e Preemptible Local SSDs (GB). Queste quote prerilasciabili si applicano alle CPU, alle GPU e alle SSD locali delle seguenti VM:

Se il tuo progetto non ha una quota prerilasciabile e non ne hai mai richiesta una, queste risorse consumano la quota standard. Tuttavia, dopo aver richiesto la quota prerilasciabile nel progetto, le risorse applicabili possono solo consumare la quota prerilasciabile e non possono tornare a utilizzare le quote standard.

La richiesta di quote prerilasciabili può aiutarti a migliorare la disponibilità delle quote fornendo quote separate per le risorse temporanee. Quando Compute Engine ti concede la quota prerilasciabile in una regione, tutte le risorse applicabili consumano automaticamente la quota prerilasciabile. Se questa quota è esaurita, devi richiedere una quota preassegnata per queste risorse.

Indirizzi IP esterni

Devi avere un numero sufficiente di indirizzi IP esterni per ogni VM che deve essere direttamente raggiungibile dalla rete internet pubblica. La quota per gli IP a livello di area geografica è destinata all'assegnazione di indirizzi IPv4 alle VM nell'area geografica in questione. La quota per gli IP globali è destinata all'assegnazione di indirizzi IPv4 alle risorse di rete globali, ad esempio i bilanciatori del carico. Google Cloud offre vari tipi di indirizzi IP, a seconda delle necessità. Per informazioni sui costi, consulta Prezzi per indirizzi IP esterni. Per informazioni sulle specifiche delle quote, consulta Quote e limiti.

  • Indirizzi IP esterni in uso. Sono inclusi gli indirizzi IP sia temporanei sia statici utilizzati da una risorsa.

  • Indirizzi IP esterni statici: sono indirizzi IP esterni prenotati per le risorse che rimangono attivi anche dopo il riavvio della macchina. Puoi registrare questi indirizzi con servizi di provider di dominio e DNS per fornire un indirizzo riconoscibile dagli utenti, ad esempio www.example-site.com.

  • Indirizzi IP interni statici:consentono di prenotare indirizzi IP interni da un intervallo IP interno configurato nella subnet. Puoi assegnare questi indirizzi interni prenotati alle risorse secondo le esigenze.

Implementazioni delle quote

Occasionalmente, Google Cloud modifica la quota predefinita per le risorse e le API. Queste modifiche vengono applicate gradualmente. Durante l'implementazione di una nuova quota predefinita, la quota massima visualizzata nella console Google Cloud potrebbe non riflettere la quota massima effettiva a tua disposizione.

Ad esempio, supponiamo che Google Cloud modifichi la quota massima predefinita per le regole del firewall da 200 a 300 e che tu utilizzi la console Google Cloud per visualizzare la quota. Potresti visualizzare la nuova quota di 300, anche se la quota effettiva è 200 fino al completamento dell'implementazione.

Per informazioni sulle implementazioni delle quote in corso, consulta i problemi noti. Se non sono descritti problemi, non sono in corso implementazioni delle quote.

Se è in corso l'implementazione di una quota e vuoi confermare la quota massima effettiva a tua disposizione, utilizza Google Cloud CLI per controllare la quota. Se hai bisogno di una quota maggiore di quella a cui hai accesso, invia una richiesta di aumento della quota.

Passaggi successivi