Questo documento elenca le quote di allocazione che si applicano a Compute Engine.
quote di allocazione
Le quote di allocazione, note anche come quote di risorse, definiscono il numero di risorse a cui ha accesso il tuo progetto. Compute Engine applica quote di allocazione sull'utilizzo delle risorse per vari motivi. Ad esempio, le quote contribuiscono a proteggere la community di utenti di Google Cloud da picchi di utilizzo imprevisti. Google Cloud offre inoltre quote per la prova gratuita che forniscono un accesso limitato ai progetti per consentirti di esplorare Google Cloud gratuitamente.
Non tutti i progetti hanno le stesse quote. Man mano che utilizzi sempre più Google Cloud nel tempo, le tue quote potrebbero aumentare di conseguenza. Se prevedi un aumento imminente e consistente dell'utilizzo, puoi richiedere un adeguamento della quota in modo proattivo nella pagina Quote della console Google Cloud.
Per informazioni specifiche sulle quote per i limiti di frequenza per l'API Compute Engine, consulta Quota API.
Quote e disponibilità delle risorse
Le quote di allocazione rappresentano il numero massimo di risorse di un determinato tipo che puoi creare, se disponibili. Le quote non garantiscono
che le risorse siano sempre disponibili. Se una risorsa non è disponibile o se la risorsa desiderata è esaurita nell'area geografica che hai scelto, non potrai creare nuove risorse del tipo scelto, anche se hai ancora a disposizione parte della quota nell'area geografica o nel progetto. Ad esempio, potresti disporre di una quota sufficiente per creare indirizzi IP esterni in us-central1
, ma potrebbero non essere disponibili indirizzi IP in questa area geografica.
Allo stesso modo, anche se disponi di una quota a livello di area geografica, è possibile che una risorsa non sia disponibile in una determinata zona. Ad esempio, potresti avere una quota per creare istanze VM nella regione us-central1
, ma potresti non essere in grado di creare istanze VM nella zona us-central1-a
se la specifica risorsa è esaurita in tale zona. In questi casi, prova a creare la stessa risorsa in un'altra zona, ad esempio us-central1-f
. Per scoprire di più sulle opzioni a tua disposizione in caso di esaurimento delle risorse in un'area specifica, consulta la documentazione sulla risoluzione dei problemi relativi alla disponibilità delle risorse.
quote di allocazione
Al momento di pianificare le esigenze per un'istanza VM, devi prendere in considerazione diverse quote che riguardano il numero di istanze VM che puoi creare.
Quote a livello di area geografica e quote globali
Le quote per le VM vengono gestite a livello di area geografica. Le quote per istanze VM, gruppi di istanze, dischi e CPU possono essere utilizzate da qualsiasi VM nella regione, indipendentemente dalla zona. Ad esempio, la quota per le CPU è a livello di area geografica, perciò il limite e il conteggio di utilizzo sono diversi per ogni area geografica. Per avviare un'istanza n2-standard-16
in qualsiasi zona dell'area geografica us-central1
, avrai bisogno di una quota sufficiente per almeno 16 CPU in us-central1
.
Per creare firewall, bilanciatori del carico, reti e VPN vengono richieste quote per networking e bilanciamento del carico. Queste quote sono globali e non dipendono da una regione. Qualsiasi area geografica può utilizzare una quota globale. Ad esempio, gli indirizzi IP esterni in uso e statici assegnati ai bilanciatori del carico e ai proxy HTTP e HTTPS utilizzano quote globali.
Istanze VM
La quota per le istanze VM è a livello di area geografica e limita il numero di istanze VM che possono trovarsi in una determinata area geografica, indipendentemente dal fatto che la VM sia in esecuzione o meno. Questa quota è visibile nella console Google Cloud nella pagina Quote. Compute Engine imposta automaticamente questa quota in modo che sia 10 volte superiore alla quota normale per le CPU. Non è necessario richiedere questa quota. Se hai bisogno di aumentare la quota per altre istanze VM, richiedi più CPU, perché un numero maggiore di CPU determina un aumento di questa quota per le istanze VM. La quota si applica alle VM in esecuzione, a quelle non in esecuzione, nonché alle istanze normali e prerilasciabili.
Nella console Google Cloud, vai alla pagina Quote.
Nell'elenco
Filtro, seleziona le seguenti opzioni:- Per Servizio, seleziona API Compute Engine.
- In Tipo, seleziona Quota.
- In Nome, seleziona Istanze VM.
- (Facoltativo) Per Metrica, seleziona un altro nome quota CPU o CPU con impegno da filtrare.
(Facoltativo) Per ordinare la tabella per regione, fai clic sulla colonna Dimensioni (ad es. località).
Seleziona le regioni di cui vuoi modificare la quota.
Fai clic su
Modifica.Compila il modulo.
Fai clic su Invia richiesta.
Gruppi di istanze
Per utilizzare i gruppi di istanze, devi avere una quota disponibile per tutte le risorse che il gruppo utilizza (ad esempio per le CPU), più una quota disponibile per la risorsa "gruppo". In base al tipo di gruppo che crei, per le risorse del gruppo si applicano le seguenti quote di utilizzo:
Tipo di servizio | Quota per servizio |
---|---|
Gruppo di istanze gestite per area geografica (più zone) | Regional instance group managers |
Gruppo di istanze gestite per zona (una sola zona) | Entrambe le opzioni:
|
Gruppo di istanze non gestite (una sola zona) | Instance groups |
Gestore della scalabilità automatica per area geografica (più zone) | Regional autoscalers |
Gestore della scalabilità automatica per zona (una sola zona) | Autoscalers |
Quote per i dischi
Le seguenti quote per Persistent Disk, Hyperdisk e SSD locali si applicano a seconda dell'area geografica:
Hyperdisk Balanced Capacity (GB)
. Questa quota corrisponde alla dimensione cumulativa totale dei dischi Hyperdisk bilanciato che puoi creare in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata comeHDB-TOTAL-GB
.Hyperdisk Balanced Throughput (MB/s)
. Questa quota corrisponde alla quantità totale di throughput che puoi eseguire il provisioning per tutti i dischi Hyperdisk bilanciati in una zona. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata comeHDB-TOTAL-THROUGHPUT
.Hyperdisk Balanced IOPS
. Questa quota corrisponde alla quantità totale di IOPS che puoi eseguire il provisioning per tutti i dischi Hyperdisk bilanciati in una zona. In gcloud CLI e nell'API, questa quota è indicata comeHDB-TOTAL-IOPS
.Hyperdisk ML Capacity (GB)
. Questa quota corrisponde alla dimensione cumulativa totale dei dischi Hyperdisk ML che puoi creare in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata comeHDML-TOTAL-GB
.Hyperdisk ML Throughput (MB/s)
. Questa quota è l'importo totale del throughput che puoi eseguire il provisioning per tutti i dischi Hyperdisk ML in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata comeHDML-TOTAL-THROUGHPUT
.Persistent disk standard (GB)
. Questa quota corrisponde alla dimensione totale dei dischi permanenti standard che si possono creare in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata comeDISKS_TOTAL_GB
. Questa quota si applica anche a:- Dischi permanenti standard a livello di area geografica, ma i dischi permanenti a livello di area geografica consumano il doppio della quantità di quota per GiB a causa dell'esistenza di repliche dei dischi in due zone all'interno della stessa area geografica.
- Quando scegli di conservare i dati dell'SSD locale quando arresti o sospendi una VM, viene consumata una quantità equivalente di quota del disco permanente standard.
Persistent disk SSD (GB)
. Questa quota corrisponde alla dimensione cumulativa totale dei volumi dei dischi permanenti basati su SSD che si possono creare in una regione. Nella gcloud CLI e nell'API, questa quota è indicata comeSSD_TOTAL_GB
. Questa quota è separata dalla quota per i dischi SSD locali. Questa quota si applica ai seguenti tipi di dischi:- Disco permanente SSD a livello di zona e di regione
- Disco permanente bilanciato a livello di zona e di regione
I dischi permanenti a livello di area geografica consumano il doppio della quantità di quota per GiB a causa dell'esistenza di repliche dei dischi in due zone all'interno della stessa area geografica.
Persistent Disk IOPS
. Questa quota corrisponde al numero totale di operazioni I/O al secondo per i volumi Extreme Persistent Disk che possono essere creati in una regione. Nella gcloud CLI e nell'API, questa quota è indicata comePD-EXTREME-TOTAL-PROVISIONED-IOPS
. Questa quota è separata dalla quota IOPS per Google Cloud Hyperdisk.Local SSD per machine family (GB)
. Questa quota corrisponde alla dimensione cumulativa totale dei dischi SSD locali che puoi collegare alle VM in una regione in base al tipo di macchina di ciascuna VM. L'unità SSD locale è un disco temporaneo veloce che va utilizzato per job di memorizzazione temporanea, inserimento nella cache locale o elaborazione con tolleranza elevata di errori, dato che il disco non è destinato a rimanere attivo quando le istanze VM vengono riavviate.I dischi SSD locali vengono venduti in incrementi di 375 GiB o 3 TiB, a seconda del tipo di macchina. Esiste inoltre un numero massimo di dischi SSD locali che possono essere collegati a una singola VM, a seconda del tipo di macchina. Il numero massimo di dischi SSD locali e le dimensioni di ciascun disco SSD locale creano un limite alla quantità totale di capacità del disco SSD locale che puoi allocare per una VM. In gcloud CLI e nell'API, questo limite è indicato come quota
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
.Per le VM A3 e A2 Ultra, non è necessario richiedere questa quota, poiché le SSD locali vengono aggiunte automaticamente a queste VM. Tuttavia, dovrai richiedere
LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY
per le altre VM ottimizzate per l'acceleratore.
Quote del pool di archiviazione
Per la capacità, i pool di archiviazione Hyperdisk con provisioning della capacità avanzata hanno le seguenti quote, misurate in GB (o 1000 MB):
Hyperdisk Balanced Storage Pools Advanced Capacity (GB)
: la quantità totale di spazio su disco che puoi prenotare per regione in un pool di archiviazione Hyperdisk bilanciato con provisioning della capacità avanzato.- Gcloud CLI e API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Metrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
- Gcloud CLI e API:
Hyperdisk Throughput Storage Pools Advanced Capacity (GB)
: la quantità totale di spazio su disco che puoi prenotare per regione in un pool di archiviazione Hyperdisk Throughput con provisioning della capacità avanzato.- Gcloud CLI e API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
- Metrica:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity
- Gcloud CLI e API:
Per le prestazioni, i pool di archiviazione Hyperdisk con provisioning avanzato delle prestazioni hanno le seguenti quote:
Hyperdisk Balanced Storage Pools Advanced IOPS
: le IOPS totali che puoi prenotare in un pool di archiviazione Hyperdisk bilanciato con provisioning delle prestazioni avanzate per una regione.- Gcloud CLI e API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
- Metrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
- Gcloud CLI e API:
Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s)
: il throughput totale che puoi prenotare in un pool di archiviazione bilanciato Hyperdisk con provisioning delle prestazioni avanzato per una regione.- Gcloud CLI e API:
HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Metrica:
compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
- Gcloud CLI e API:
Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s)
: il throughput totale che puoi prenotare in un pool dello spazio di archiviazione Hyperdisk Throughput con provisioning delle prestazioni avanzato per una regione.- Gcloud CLI e API:
HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
- Metrica:
compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput
- Gcloud CLI e API:
Limiti di quota CPU
La quota per le CPU è il numero totale di CPU virtuali in tutte le istanze VM in un'area geografica. Le quote per le CPU si applicano alle VM in esecuzione e alle prenotazioni di VM. Questa quota viene utilizzata sia dalle VM prerilasciabili sia da quelle predefinite.
Per contribuire a proteggere i sistemi Compute Engine e altri utenti, alcuni nuovi account e progetti dispongono anche di una quota CPUs (All Regions)
globale. Questa quota si applica a tutte le regioni e viene misurata come somma di tutte le vCPU in tutte le regioni.
Ad esempio, se ti rimangono 48 vCPU in una sola area geografica, come
us-central1
ma solo 32 vCPU per la quota CPUs (All Regions)
,
puoi avviare solo 32 vCPU nell'area geografica us-central1
, anche se non hai esaurito la quota in quell'area geografica. Il motivo è che raggiungerai la quota CPU (All Regions)
e dovrai eliminare alcune istanze esistenti per poterne avviare di nuove.
I tipi di macchine E2 e N1 condividono un pool di quote per le CPU. Se non diversamente specificato, tutti gli altri tipi di macchine hanno pool di quote per le CPU univoci separati.
Se utilizzi gli sconti per impegno di utilizzo per le tue VM, devi avere una quota di sconto per impegno di utilizzo prima di acquistare un contratto di sconto per impegno di utilizzo.
Tipo di macchina | Pool di quote | Nome quota CPU | Nome quota CPU con impegno |
---|---|---|---|
N1 | pool condiviso | CPUS |
Committed_CPUS |
E2 | pool condiviso | CPUS |
Committed_CPUS |
N2 | pool separato | N2_CPUS |
Committed_N2_CPUS |
N4 | pool separato | CPUS_PER_VM_FAMILY |
Committed_N4_CPUS |
N2D | pool separato | N2D_CPUS |
Committed_N2D_CPUS |
T2D | pool separato | T2D_CPUS |
Committed_T2D_CPUS |
T2A | pool separato | T2A_CPUS |
Non disponibile (N/A) per T2A |
Z3 | pool separato | CPUS_PER_VM_FAMILY |
Committed_Z3_CPUS |
M1 | pool separato | M1_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M2 | pool separato | M2_CPUS |
Committed_MEMORY-OPTIMIZED_CPUS |
M3 | pool separato | M3_CPUS |
Committed_M3_CPUS |
X4 | pool separato | CPUS_PER_VM_FAMILY |
Committed_X4_CPUS |
H3 | pool separato | CPUS_PER_VM_FAMILY |
Committed_H3_CPUS |
C2 | pool separato | C2_CPUS |
Committed_C2_CPUS |
C2D | pool separato | C2D_CPUS |
Committed_C2D_CPUS |
C3 | pool separato | C3_CPUS |
Committed_C3_CPUS |
C3D | pool separato | CPUS_PER_VM_FAMILY |
Committed_C3D_CPUS |
C4 | pool separato | CPUS_PER_VM_FAMILY |
Committed_C4_CPUS |
C4A | pool separato | CPUS_PER_VM_FAMILY |
Committed_C4A_CPUS |
A2* | pool separato | A2_CPUS |
Committed_A2_CPUS |
A3† | Non applicabile (N/A) per A3 | Non applicabile (N/A) per A3 | Non applicabile (N/A) per A3 |
G2† | Non applicabile (N/A) per G2 | Non applicabile (N/A) per G2 | Non applicabile (N/A) per G2 |
VM prerilasciabili | pool condiviso | PREEMPTIBLE_CPUS |
Non disponibile (N/A) per le VM preemptibili |
*Per le VM A2, non è necessario richiedere quote CPU. Se disponi delle quote GPU NVIDIA A100 richieste, non è necessario altro per creare queste VM.
†Per le VM A3 e G2, le quote CPU non sono applicabili. Se disponi delle quote GPU NVIDIA H100 e L4 richieste, non è necessario altro per creare queste VM.
Quota per le GPU
Come nel caso della quota per le CPU virtuali, quella per le GPU si riferisce al numero totale di GPU virtuali in tutte le istanze VM di un'area geografica. Le quote GPU si applicano alle VM in esecuzione e alle prenotazioni VM. Questa quota viene utilizzata sia dalle VM predefinite sia da quelle prerilasciabili.
Consulta la pagina Quote per assicurarti di disporre di un numero sufficiente di GPU nel progetto e per richiedere un aumento della quota. Inoltre, tieni presente che nuovi account e progetti avranno una quota GPU globale valida in tutte le aree geografiche.
Quando richiedi una quota GPU, devi richiedere una quota per i modelli di GPU che vuoi creare in ciascuna regione, oltre a una quota globale aggiuntiva (GPUs (all regions)
) per il numero totale di GPU di tutti i tipi in tutte le regioni.
Richiedi una quota GPU preassegnata per utilizzare queste risorse.
Tipo di macchina | Tipo di GPU | Nome quota GPU | Famiglia di GPU | Nome quota GPU con impegno | Workstation virtuale | GPU prerilasciabili | Workstation virtuale GPU prerilasciabili |
---|---|---|---|---|---|---|---|
A3 Mega | H100 80GB | GPUS_PER_GPU_FAMILY |
NVIDIA_H100_MEGA |
COMMITTED_NVIDIA_H100_MEGA_GPUS |
N/D | PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS |
N/D |
A3 Edge e A3 High | H100 80GB | GPUS_PER_GPU_FAMILY |
NVIDIA_H100 |
COMMITTED_NVIDIA_H100_GPUS |
N/D | PREEMPTIBLE_NVIDIA_H100_GPUS |
N/D |
A2 Ultra | A100 80 GB | NVIDIA_A100_80GB_GPUS |
N/D | COMMITTED_NVIDIA_A100_80GB_GPUS |
N/A | PREEMPTIBLE_NVIDIA_A100_80GB_GPUS |
N/D |
A2 Standard | A100 40 GB | NVIDIA_A100_GPUS |
N/D | COMMITTED_NVIDIA_A100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_A100_GPUS |
N/D |
G2 | L4 | NVIDIA_L4_GPUS |
N/D | COMMITTED_NVIDIA_L4_GPUS |
NVIDIA_L4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_L4_GPUS |
PREEMPTIBLE_NVIDIA_L4_VWS_GPUS |
N1 | T4 | NVIDIA_T4_GPUS |
N/D | COMMITTED_NVIDIA_T4_GPUS |
NVIDIA_T4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_T4_GPUS |
PREEMPTIBLE_NVIDIA_T4_VWS_GPUS |
V100 | NVIDIA_V100_GPUS |
N/D | COMMITTED_NVIDIA_V100_GPUS |
N/A | PREEMPTIBLE_NVIDIA_V100_GPUS |
N/D | |
P100 | NVIDIA_P100_GPUS |
N/D | COMMITTED_NVIDIA_P100_GPUS |
NVIDIA_P100_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P100_GPUS |
PREEMPTIBLE_NVIDIA_P100_VWS_GPUS |
|
P4 | NVIDIA_P4_GPUS |
N/D | COMMITTED_NVIDIA_P4_GPUS |
NVIDIA_P4_VWS_GPUS |
PREEMPTIBLE_NVIDIA_P4_GPUS |
PREEMPTIBLE_NVIDIA_P4_VWS_GPUS |
Quote preemptible
Puoi richiedere quote prerilasciabili per Preemptible CPUs
, Preemptible GPUs
e
Preemptible Local SSDs (GB)
. Queste quote prerilasciabili si applicano alle CPU, alle GPU e alle SSD locali delle seguenti VM:
Se il tuo progetto non ha una quota prerilasciabile e non ne hai mai richiesta una, queste risorse consumano la quota standard. Tuttavia, dopo aver richiesto la quota prerilasciabile nel progetto, le risorse applicabili possono solo consumare la quota prerilasciabile e non possono tornare a utilizzare le quote standard.
La richiesta di quote prerilasciabili può aiutarti a migliorare la disponibilità delle quote fornendo quote separate per le risorse temporanee. Quando Compute Engine ti concede la quota prerilasciabile in una regione, tutte le risorse applicabili consumano automaticamente la quota prerilasciabile. Se questa quota è esaurita, devi richiedere una quota preassegnata per queste risorse.
Indirizzi IP esterni
Devi avere un numero sufficiente di indirizzi IP esterni per ogni VM che deve essere direttamente raggiungibile dalla rete internet pubblica. La quota per gli IP a livello di area geografica è destinata all'assegnazione di indirizzi IPv4 alle VM nell'area geografica in questione. La quota per gli IP globali è destinata all'assegnazione di indirizzi IPv4 alle risorse di rete globali, ad esempio i bilanciatori del carico. Google Cloud offre vari tipi di indirizzi IP, a seconda delle necessità. Per informazioni sui costi, consulta Prezzi per indirizzi IP esterni. Per informazioni sulle specifiche delle quote, consulta Quote e limiti.
Indirizzi IP esterni in uso. Sono inclusi gli indirizzi IP sia temporanei sia statici utilizzati da una risorsa.
Indirizzi IP esterni statici: sono indirizzi IP esterni prenotati per le risorse che rimangono attivi anche dopo il riavvio della macchina. Puoi registrare questi indirizzi con servizi di provider di dominio e DNS per fornire un indirizzo riconoscibile dagli utenti, ad esempio www.example-site.com.
Indirizzi IP interni statici:consentono di prenotare indirizzi IP interni da un intervallo IP interno configurato nella subnet. Puoi assegnare questi indirizzi interni prenotati alle risorse secondo le esigenze.
Implementazioni delle quote
Occasionalmente, Google Cloud modifica la quota predefinita per le risorse e le API. Queste modifiche vengono applicate gradualmente. Durante l'implementazione di una nuova quota predefinita, la quota massima visualizzata nella console Google Cloud potrebbe non riflettere la quota massima effettiva a tua disposizione.
Ad esempio, supponiamo che Google Cloud modifichi la quota massima predefinita per le regole del firewall da 200
a 300
e che tu utilizzi la console Google Cloud per visualizzare la quota. Potresti visualizzare la nuova quota di 300
, anche se la quota effettiva è 200
fino al completamento dell'implementazione.
Per informazioni sulle implementazioni delle quote in corso, consulta i problemi noti. Se non sono descritti problemi, non sono in corso implementazioni delle quote.
Se è in corso l'implementazione di una quota e vuoi confermare la quota massima effettiva a tua disposizione, utilizza Google Cloud CLI per controllare la quota. Se hai bisogno di una quota maggiore di quella a cui hai accesso, invia una richiesta di aumento della quota.
Passaggi successivi
- Scopri di più sui prezzi basati sulle risorse.
- Scopri di più sui prezzi delle istanze VM.
- Scopri come visualizzare e gestire la quota.
- Scopri come configurare gli avvisi sulla quota.
- Scopri come aumentare automaticamente la quota in base all'utilizzo delle risorse Compute Engine.