quote di allocazione


Questo documento elenca le quote di allocazione che si applicano a Compute Engine.

quote di allocazione

Le quote di allocazione, note anche come quote delle risorse, definiscono il numero le risorse a cui ha accesso il tuo progetto. Compute Engine applica quote di allocazione sull'utilizzo delle risorse per vari motivi. Ad esempio, le quote contribuire a proteggere la community degli utenti di Google Cloud impedendo di picchi di utilizzo imprevisti. Google Cloud offre inoltre quote per la prova gratuita che forniscono un accesso limitato ai progetti per consentirti di esplorare Google Cloud gratuitamente.

Non tutti i progetti hanno le stesse quote. Poiché utilizzi sempre più Google Cloud nel tempo, le tue quote potrebbero aumentare di conseguenza. Se un aumento imminente e consistente dell'utilizzo, puoi richiedere gli aggiustamenti della quota Quote nel nella console Google Cloud.

Per informazioni specifiche sulle quote per i limiti di frequenza per l'API Compute Engine, consulta Quota API.

Quote e disponibilità delle risorse

Le quote di allocazione rappresentano il numero massimo di risorse di un determinato tipo che puoi creare, se disponibili. Le quote non garantiscono che le risorse siano sempre disponibili. Se una risorsa non è disponibile o se la risorsa desiderata è esaurita nell'area geografica che hai scelto, non potrai creare nuove risorse del tipo scelto, anche se hai ancora a disposizione parte della quota nell'area geografica o nel progetto. Ad esempio, potresti disporre di una quota sufficiente per creare indirizzi IP esterni in us-central1, ma potrebbero non essere disponibili indirizzi IP in questa area geografica.

Allo stesso modo, anche se disponi di una quota a livello di area geografica, è possibile che una risorsa non sia disponibile in una determinata zona. Ad esempio, potresti disporre di una quota sufficiente per creare regione us-central1, ma potresti non essere in grado di creare istanze VM zona us-central1-a se la zona è esaurita. In questi casi, prova a creare la stessa risorsa in un'altra zona, ad esempio us-central1-f. Per scoprire di più sulle opzioni a tua disposizione in caso di esaurimento delle risorse in un'area specifica, consulta la documentazione sulla risoluzione dei problemi relativi alla disponibilità delle risorse.

quote di allocazione

Al momento di pianificare le esigenze per un'istanza VM, devi prendere in considerazione diverse quote che riguardano il numero di istanze VM che puoi creare.

Quote a livello di area geografica e quote globali

Le quote per le VM vengono gestite a livello di area geografica. Le quote per istanze VM, gruppi di istanze, dischi e CPU possono essere utilizzate da qualsiasi VM nella regione, indipendentemente dalla zona. Ad esempio, la quota per le CPU è a livello di area geografica, perciò il limite e il conteggio di utilizzo sono diversi per ogni area geografica. Per avviare un'istanza n2-standard-16 in qualsiasi zona dell'area geografica us-central1, avrai bisogno di una quota sufficiente per almeno 16 CPU in us-central1.

Per creare firewall, bilanciatori del carico, reti e VPN vengono richieste quote per networking e bilanciamento del carico. Queste quote sono globali e non dipendono in una regione. Qualsiasi area geografica può utilizzare una quota globale. Ad esempio, in uso e statico indirizzi IP esterni assegnati a bilanciatori del carico e proxy HTTP e HTTPS e consumano quote globali.

Istanze VM

La quota delle istanze VM è regionale e limita il numero di istanze VM che possono esistere in una determinata regione, indipendentemente dal fatto che la VM sia in esecuzione. Questo è visibile nella pagina Quote della console Google Cloud. Compute Engine imposta automaticamente questa quota in modo che sia 10 volte superiore alla quota normale per le CPU. Non è necessario richiedere questa quota. Se hai bisogno di quota per più VM richiedono più CPU perché un numero maggiore di CPU aumenta quota di istanza. La quota si applica alle VM in esecuzione e a quelle non in esecuzione. normali e prerilasciabili.

  1. Nella console Google Cloud, vai alla pagina Quote.

    Vai a Quote

  2. Nell'elenco Filtro, seleziona le seguenti opzioni:

    • In Servizio, seleziona API Compute Engine.
    • In Tipo, seleziona Quota.
    • In Nome, seleziona Istanze VM.
    • (Facoltativo) Per Metrica, seleziona un altro nome quota CPU o CPU con impegno da filtrare.
  3. (Facoltativo) Per ordinare la tabella per regione, fai clic sulla colonna Dimensioni (ad es. località).

  4. Seleziona le regioni di cui vuoi modificare la quota.

  5. Fai clic su Modifica.

  6. Compila il modulo.

  7. Fai clic su Invia richiesta.

Gruppi di istanze

Per utilizzare i gruppi di istanze, devi disporre di una quota disponibile per tutte le risorse utilizzata dal gruppo (ad esempio, la quota di CPU) e la quota disponibile la risorsa del gruppo stessa. In base al tipo di gruppo che crei, per le risorse del gruppo si applicano le seguenti quote di utilizzo:

Tipo di servizio Quota per servizio
Gruppo di istanze gestite per area geografica (più zone) Regional instance group managers
Gruppo di istanze gestite per zona (una sola zona) Entrambe le opzioni:
  • Instance group managers
  • Instance groups
Gruppo di istanze non gestite (una sola zona) Instance groups
Gestore della scalabilità automatica per area geografica (più zone) Regional autoscalers
Gestore della scalabilità automatica per zona (una sola zona) Autoscalers

Quote per i dischi

Le seguenti quote per dischi permanenti, Hyperdisk e SSD locali si applicano a seconda dell'area geografica:

  • Hyperdisk Balanced Capacity (GB). Questa quota corrisponde alla dimensione cumulativa totale dei dischi Hyperdisk bilanciato che puoi creare in una regione. In gcloud CLI e nell'API, viene detta HDB-TOTAL-GB.
  • Hyperdisk Balanced Throughput (MB/s). Questa quota è la quantità totale di cui è possibile eseguire il provisioning per tutti i dischi Hyperdisk bilanciati in una zona. In gcloud CLI e nell'API, viene detta HDB-TOTAL-THROUGHPUT.
  • Hyperdisk Balanced IOPS. Questa quota corrisponde alla quantità totale di IOPS che puoi eseguire il provisioning per tutti i dischi Hyperdisk bilanciati in una zona. Nella gcloud CLI e l'API, questo viene detta HDB-TOTAL-IOPS.
  • Hyperdisk ML Capacity (GB). Questa quota corrisponde alla dimensione cumulativa totale dei dischi Hyperdisk ML che puoi creare in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata come HDML-TOTAL-GB.
  • Hyperdisk ML Throughput (MB/s). Questa quota è la quantità totale di cui è possibile eseguire il provisioning per tutti i dischi Hyperdisk ML in una regione. Nell'API e nell'interfaccia a riga di comando gcloud, questa quota è indicata come HDML-TOTAL-THROUGHPUT.
  • Persistent disk standard (GB). Questa quota corrisponde alla dimensione totale dei dischi permanenti standard che si possono creare in una regione. In gcloud CLI e nell'API, viene detta DISKS_TOTAL_GB. Questa quota si applica anche a:
    • Dischi permanenti standard a livello di area geografica, ma i dischi permanenti a livello di area geografica consumano il doppio della quantità di quota per GiB a causa dell'esistenza di repliche dei dischi in due zone all'interno della stessa area geografica.
    • Se scegli di conservare i dati degli SSD locali quando arresti o sospendi una VM, viene consumata una quantità equivalente di quota di disco permanente standard.
  • Persistent disk SSD (GB). Questa quota corrisponde alla dimensione cumulativa totale dei volumi dei dischi permanenti basati su SSD che si possono creare in una regione. In gcloud CLI e nell'API, questa quota è detta SSD_TOTAL_GB. Questa quota è separata per i dischi SSD locali. Questa quota si applica ai seguenti tipi di disco:

    • Disco permanente SSD a livello di zona e di regione
    • Disco permanente bilanciato a livello di zona e di regione

    I dischi permanenti a livello di area geografica consumano il doppio della quantità di quota per GiB a causa dell'esistenza di repliche dei dischi in due zone all'interno della stessa area geografica.

  • Persistent Disk IOPS. Questa quota corrisponde al numero totale di operazioni I/O al secondo per i volumi Extreme Persistent Disk che possono essere creati in una regione. In gcloud CLI l'API, questa quota è detta PD-EXTREME-TOTAL-PROVISIONED-IOPS. Questa quota è separata dalla quota IOPS per Hyperdisk di Google Cloud.

  • Local SSD per machine family (GB). Questa quota è la dimensione combinata totale Dischi SSD locali che puoi collegare alle VM in una regione in base al tipo di macchina di ciascuna VM. L'unità SSD locale è un disco temporaneo veloce che va utilizzato per job di memorizzazione temporanea, inserimento nella cache locale o elaborazione con tolleranza elevata di errori, dato che il disco non è destinato a rimanere attivo quando le istanze VM vengono riavviate.

    I dischi SSD locali vengono venduti in incrementi di 375 GiB o 3 TiB, a seconda del tipo di macchina. C'è anche un numero massimo di dischi SSD locali che possono essere collegati a una singola VM, a seconda del tipo di macchina. Il numero massimo di dischi SSD locali e le dimensioni di ciascun disco SSD locale creano un limite alla quantità totale di capacità del disco SSD locale che puoi allocare per una VM. Nella gcloud CLI e l'API, questo limite è indicato come quota LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY.

    Per le VM A3 e A2 Ultra, non è necessario richiedere questa quota, poiché le SSD locali vengono aggiunte automaticamente a queste VM. Tuttavia, dovrai richiedere LOCAL_SSD_TOTAL_GB_PER_VM_FAMILY per le altre VM ottimizzate per l'acceleratore.

Quote del pool di archiviazione

Per la capacità, pool di archiviazione Hyperdisk con provisioning avanzato della capacità con le seguenti quote, misurate in GB (o 1000 MB):

  • Hyperdisk Balanced Storage Pools Advanced Capacity (GB): la quantità totale di spazio su disco che puoi prenotare per regione in un pool di archiviazione Hyperdisk bilanciato con provisioning della capacità avanzata.

    • gcloud CLI e l'API: HDB-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Metrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_capacity
  • Hyperdisk Throughput Storage Pools Advanced Capacity (GB): lo spazio su disco totale che puoi prenotare per regione in un pool di archiviazione Hyperdisk Throughput con provisioning della capacità avanzata.

    • Interfaccia a riga di comando gcloud e API: HDT-STORAGE-POOL-TOTAL-ADVANCED-CAPACITY
    • Metrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_capacity

Per le prestazioni, i pool di archiviazione Hyperdisk con il provisioning avanzato delle prestazioni hanno le seguenti quote:

  • Hyperdisk Balanced Storage Pools Advanced IOPS: le IOPS totali che puoi prenotare in un pool di archiviazione Hyperdisk bilanciato con provisioning delle prestazioni avanzate per una regione.

    • gcloud CLI e l'API: HDB-STORAGE-POOL-TOTAL-ADVANCED-IOPS
    • Metrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_iops
  • Hyperdisk Balanced Storage Pools Advanced Throughput (MB/s): il throughput totale che puoi prenotare in un pool di archiviazione Hyperdisk bilanciato con il provisioning delle prestazioni avanzato per una regione.

    • gcloud CLI e l'API: HDB-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Metrica: compute.googleapis.com/hyperdisk_balanced_storage_pools_advanced_throughput
  • Hyperdisk Throughput Storage Pools Advanced Throughput (MB/s): il totale velocità effettiva che puoi prenotare in un pool di archiviazione per la velocità effettiva Hyperdisk con prestazioni avanzate il provisioning per una regione.

    • gcloud CLI e l'API: HDT-STORAGE-POOL-TOTAL-ADVANCED-THROUGHPUT
    • Metrica: compute.googleapis.com/hyperdisk_throughput_storage_pools_advanced_throughput

Limiti di quota CPU

La quota per le CPU è il numero totale di CPU virtuali in tutte le istanze VM in un'area geografica. Le quote per le CPU si applicano alle VM e alle VM in esecuzione prenotazioni. Questa quota viene utilizzata sia dalle VM prerilasciabili sia da quelle predefinite.

Per proteggere i sistemi Compute Engine e gli altri utenti, sono state introdotte anche gli account e i progetti hanno una quota globale CPUs (All Regions). Questa quota si applica a tutte le regioni e viene misurata come somma di tutte le vCPU in tutte le regioni.

Ad esempio, se ti rimangono 48 vCPU in una sola area geografica, come us-central1 ma solo 32 vCPU per la quota CPUs (All Regions), puoi avviare solo 32 vCPU nell'area geografica us-central1, anche se non hai esaurito la quota in quell'area geografica. Il motivo è che raggiungerai la quota CPU (All Regions) e dovrai eliminare alcune istanze esistenti per poterne avviare di nuove.

I tipi di macchine E2 e N1 condividono un pool di quote per le CPU. Se non diversamente specificato, tutti gli altri tipi di macchine hanno pool di quote per le CPU univoci separati.

Se utilizzi sconti per impegno di utilizzo per le tue VM, devi averti impegnato la quota di sconto per impegno di utilizzo prima di acquistare un contratto di sconto per impegno di utilizzo.

Tipo di macchina Pool di quota Nome quota CPU Nome quota CPU con impegno
N1 pool condiviso CPUS Committed_CPUS
E2 pool condiviso CPUS Committed_CPUS
N2 pool separato N2_CPUS Committed_N2_CPUS
N4 pool separato CPUS_PER_VM_FAMILY Committed_N4_CPUS
N2D pool separato N2D_CPUS Committed_N2D_CPUS
T2D pool separato T2D_CPUS Committed_T2D_CPUS
Livello 2 pool separato T2A_CPUS Non disponibile (N/A) per T2A
Z3 pool separato CPUS_PER_VM_FAMILY Committed_Z3_CPUS
M1 pool separato M1_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M2 pool separato M2_CPUS Committed_MEMORY-OPTIMIZED_CPUS
M3 pool separato M3_CPUS Committed_M3_CPUS
X4 pool separato CPUS_PER_VM_FAMILY Committed_X4_CPUS
H3 pool separato CPUS_PER_VM_FAMILY Committed_H3_CPUS
C2 pool separato C2_CPUS Committed_C2_CPUS
C2D pool separato C2D_CPUS Committed_C2D_CPUS
C3 pool separato C3_CPUS Committed_C3_CPUS
C3D pool separato CPUS_PER_VM_FAMILY Committed_C3D_CPUS
C4 pool separato CPUS_PER_VM_FAMILY Committed_C4_CPUS
A2* pool separato A2_CPUS Committed_A2_CPUS
A3 Non applicabile (N/A) per A3 Non applicabile (N/A) per A3 Non applicabile (N/A) per A3
G2 Non applicabile (N/A) per G2 Non applicabile (N/A) per G2 Non applicabile (N/A) per G2
VM prerilasciabili pool condiviso PREEMPTIBLE_CPUS Non disponibile (N/A) per le VM preemptibili

* Per le VM A2, non è necessario richiedere quote per la CPU. Se disponi le quote GPU NVIDIA A100 richieste, che è tutto ciò che serve per creare queste VM.

Per le VM A3 e G2, le quote CPU non sono applicabili. Se disponi delle quote GPU NVIDIA H100 e L4 richieste, non è necessario altro per creare queste VM.

Quota per le GPU

Come nel caso della quota per le CPU virtuali, quella per le GPU si riferisce al numero totale di GPU virtuali in tutte le istanze VM di un'area geografica. Le quote GPU si applicano alle VM in esecuzione e alle prenotazioni di VM. Questa quota viene utilizzata sia dalle VM predefinite sia da quelle prerilasciabili.

Consulta la pagina Quote per assicurarti di disporre di un numero sufficiente di GPU nel progetto e per richiedere un aumento della quota. Inoltre, tieni presente che nuovi account e progetti avranno una quota GPU globale valida in tutte le aree geografiche.

Quando richiedi una quota GPU, devi richiedere una quota per i modelli GPU che da creare in ogni regione e una quota globale aggiuntiva (GPUs (all regions)) per il numero totale di GPU di tutti i tipi in tutte le regioni. Richiedi una quota GPU preassegnata per utilizzare queste risorse.

Tipo di macchina Tipo di GPU Nome quota GPU Famiglia di GPU Nome quota GPU con impegno Workstation virtuale GPU prerilasciabili Workstation virtuale GPU prerilasciabili
A3 Mega H100 80 GB Mega GPUS_PER_GPU_FAMILY NVIDIA_H100_MEGA COMMITTED_NVIDIA_H100_MEGA_GPUS N/D PREEMPTIBLE_NVIDIA_H100_MEGA_GPUS N/D
A3 High H100 da 80 GB GPUS_PER_GPU_FAMILY NVIDIA_H100 COMMITTED_NVIDIA_H100_GPUS N/D PREEMPTIBLE_NVIDIA_H100_GPUS N/D
A2 Standard A100 40GB NVIDIA_A100_GPUS N/D COMMITTED_NVIDIA_A100_GPUS N/A PREEMPTIBLE_NVIDIA_A100_GPUS N/D
A2 Ultra A100 80 GB NVIDIA_A100_80GB_GPUS N/D COMMITTED_NVIDIA_A100_80GB_GPUS N/A PREEMPTIBLE_NVIDIA_A100_80GB_GPUS N/D
G2 L4 NVIDIA_L4_GPUS N/D COMMITTED_NVIDIA_L4_GPUS NVIDIA_L4_VWS_GPUS PREEMPTIBLE_NVIDIA_L4_GPUS PREEMPTIBLE_NVIDIA_L4_VWS_GPUS
N1 T4 NVIDIA_T4_GPUS N/D COMMITTED_NVIDIA_T4_GPUS NVIDIA_T4_VWS_GPUS PREEMPTIBLE_NVIDIA_T4_GPUS PREEMPTIBLE_NVIDIA_T4_VWS_GPUS
V100 NVIDIA_V100_GPUS N/D COMMITTED_NVIDIA_V100_GPUS N/A PREEMPTIBLE_NVIDIA_V100_GPUS N/D
P100 NVIDIA_P100_GPUS N/D COMMITTED_NVIDIA_P100_GPUS NVIDIA_P100_VWS_GPUS PREEMPTIBLE_NVIDIA_P100_GPUS PREEMPTIBLE_NVIDIA_P100_VWS_GPUS
P4 NVIDIA_P4_GPUS N/D COMMITTED_NVIDIA_P4_GPUS NVIDIA_P4_VWS_GPUS PREEMPTIBLE_NVIDIA_P4_GPUS PREEMPTIBLE_NVIDIA_P4_VWS_GPUS

Quote prerilasciabili

Puoi richiedere quote prerilasciabili per Preemptible CPUs, Preemptible GPUs e Preemptible Local SSDs (GB). Queste quote prerilasciabili si applicano alle CPU, alle GPU e alle SSD locali delle seguenti VM:

Se il tuo progetto non ha una quota prerilasciabile e non hai mai richiesto prerilasciabile, queste risorse consumano quella standard. Tuttavia, dopo aver richiedere una quota prerilasciabile nel tuo progetto, le risorse applicabili possono consumano quota prerilasciabile e non possono tornare a utilizzare le quote standard.

La richiesta di quote prerilasciabili può aiutarti a migliorare l'ottenimento della quota offrendo quote separate per le risorse temporanee. Quando Compute Engine ti concede la quota prerilasciabile in una regione, tutte le risorse applicabili consumano automaticamente la quota prerilasciabile. Se questa quota è esaurita, devi richiedere prerilasciabile per quelle risorse.

Indirizzi IP esterni

Devi disporre di un numero sufficiente di indirizzi IP esterni per ogni VM direttamente dalla rete internet pubblica. La quota per gli IP a livello di regione può essere assegnata gli indirizzi IPv4 alle VM in quella regione. La quota per gli IP globali è destinata all'assegnazione di indirizzi IPv4 alle risorse di rete globali, ad esempio i bilanciatori del carico. Google Cloud offre vari tipi di indirizzi IP, a seconda delle necessità. Per informazioni sui costi, consulta Prezzi per indirizzi IP esterni. Per informazioni sulle specifiche della quota, consulta Quote e limiti.

  • Indirizzi IP esterni in uso. Include IP sia temporaneo che statico di indirizzi IP usati da una risorsa.

  • Indirizzi IP esterni statici: sono indirizzi IP esterni prenotati per le risorse che rimangono attivi anche dopo il riavvio della macchina. Puoi registrare questi indirizzi con servizi di provider di dominio e DNS per fornire un indirizzo riconoscibile dagli utenti, ad esempio www.example-site.com.

  • Indirizzi IP interni statici: consentono di prenotare indirizzi IP interni da un intervallo IP interno configurato nella subnet. Puoi assegnare questi indirizzi interni prenotati alle risorse secondo le esigenze.

Implementazioni delle quote

Occasionalmente, Google Cloud modifica la quota predefinita per le risorse e le API. Queste modifiche vengono applicate gradualmente. Durante l'implementazione di una nuova quota predefinita, la quota massima visualizzata nella console Google Cloud potrebbe non riflettere la quota massima effettiva a tua disposizione.

Ad esempio, supponiamo che Google Cloud modifichi la quota massima predefinita per le regole del firewall da 200 a 300 e che tu utilizzi la console Google Cloud per visualizzare la quota. Potresti visualizzare la nuova quota di 300, anche se la quota effettiva è 200 fino al completamento dell'implementazione.

Per informazioni sulle implementazioni delle quote in corso, consulta Problemi noti. Se non sono descritti problemi, non sono in corso implementazioni delle quote.

Se è in corso un'implementazione della quota e vuoi confermare la quota massima effettiva a tua disposizione, usa Google Cloud CLI per controllare la quota. Se hai bisogno di una quota maggiore di quella a cui hai accesso, invia una richiesta di aumento della quota.

Passaggi successivi