Quote e limiti


Questo documento elenca le quote e i limiti di sistema che si applicano a Google Kubernetes Engine. Le quote specificano la quantità di una risorsa condivisa e conteggiabile che puoi utilizzare e sono definite dai servizi Google Cloud come Google Kubernetes Engine. I limiti di sistema sono valori fissi che non possono essere modificati.

Google Cloud utilizza le quote per contribuire a garantire l'equità e ridurre gli picchi di utilizzo e disponibilità delle risorse. Una quota limita la quantità di una risorsa Google Cloud che può essere utilizzata nel progetto Google Cloud. Le quote si applicano a una serie di tipi di risorse, inclusi hardware, software e componenti di rete. Ad esempio, le quote possono limitare il numero di chiamate API a un servizio, il numero di bilanciatori del carico utilizzati contemporaneamente dal tuo progetto o il numero di progetti che puoi creare. Le quote proteggono la community degli utenti di Google Cloud impedendo il sovraccarico dei servizi. Le quote ti aiutano anche a gestire le tue risorse Google Cloud.

Il sistema delle quote di Cloud esegue le seguenti operazioni:

  • Monitora il tuo consumo di prodotti e servizi Google Cloud
  • Limita il consumo di queste risorse
  • Fornisce un modo per richiedere modifiche al valore della quota

Nella maggior parte dei casi, quando provi a consumare più di una risorsa rispetto a quanto consentito dalla quota, il sistema blocca l'accesso alla risorsa e l'attività che stai tentando di eseguire non va a buon fine.

In genere, le quote si applicano a livello di progetto Google Cloud. L'utilizzo di una risorsa in un progetto non influisce sulla quota disponibile in un altro progetto. All'interno di un progetto Google Cloud, le quote sono condivise tra tutte le applicazioni e gli indirizzi IP.

Per modificare la maggior parte delle quote, utilizza la console Google Cloud. Per ulteriori informazioni, consulta Richiedere un aggiustamento della quota.

Esistono anche limiti di sistema per le risorse GKE. I limiti di sistema non possono essere modificati.

Limiti per progetto

In un singolo progetto, puoi creare un massimo di 100 cluster zonali per zona, oltre a 100 cluster regionali per regione.

Nota: i cluster creati in modalità Autopilot sono preconfigurati come cluster regionali.

Limiti per cluster

Le seguenti tabelle descrivono i limiti per cluster GKE.

Tutte le versioni di GKE specificate nella tabella seguente si applicano sia ai nodi del cluster sia al piano di controllo.

Limiti Cluster GKE Standard Cluster GKE Autopilot
Nodi per cluster 65.000 nodi

Se prevedi di utilizzare questo limite, tieni presente i seguenti consigli quando progetti l'architettura GKE:

5000 nodi

Se prevedi di utilizzare questo limite, tieni presente i seguenti consigli quando progetti l'architettura GKE:

  • Se prevedi di eseguire più di 1000 nodi, utilizza GKE Autopilot versione 1.23 o successiva.
  • L'esecuzione di più di 400 nodi potrebbe richiedere l'aumento della quota per le dimensioni del cluster per i cluster creati in versioni precedenti. Contatta l'assistenza per ricevere aiuto.
Nodi per pool di nodi 1000 nodi per zona

2000 nodi TPU per zona: richiede le seguenti versioni o versioni successive: 1.28.5-gke.135500, 1.29.1-gke.1206000, 1.30
Non applicabile
Nodi in una zona
  • Nessuna limitazione di nodi per il bilanciamento del carico nativo del container con Ingress basato su NEG, che è consigliato quando possibile. In GKE 1.17 e versioni successive, l'Ingress basato su NEG è la modalità predefinita.
  • 1000 nodi se utilizzi un Ingress basato sul gruppo di istanze.
Non applicabile
Pod per nodo1 256 pod

Nota:per le versioni di GKE precedenti a 1.23.5-gke.1300, il limite è 110 pod.

Impostato dinamicamente su qualsiasi valore compreso tra 8 e 256. GKE prende in considerazione le dimensioni del cluster e il numero di carichi di lavoro per eseguire il provisioning del numero massimo di pod per nodo.

  • Per le versioni di GKE precedenti alla 1.28, il limite è di 32 pod.
  • Per i pod di classe Accelerator e Performance, il limite è di un pod per nodo.
Pod per cluster2 200.000 pod1 200.000 pod
Container per cluster 400.000 container 400.000 container
Dimensioni del database Etcd 6 GB 6 GB

In qualità di amministratore della piattaforma, ti consigliamo di acquisire familiarità con il modo in cui le quote influiscono sui workload di grandi dimensioni in esecuzione su GKE. Per ulteriori consigli, best practice, limiti e quote per carichi di lavoro di grandi dimensioni, consulta le linee guida per la creazione di cluster scalabili.

Limite per le richieste API

Il limite di frequenza predefinito per l'API Kubernetes Engine è di 3000 richieste al minuto, applicato a intervalli di 100 secondi.

Quote delle risorse

Per i cluster con meno di 100 nodi, GKE applica la quota delle risorse Kubernetes a ogni spazio dei nomi. Queste quote proteggono il piano di controllo del cluster dall'instabilità causata da potenziali bug nelle applicazioni di cui è stato eseguito il deployment nel cluster. Non puoi rimuovere queste quote perché vengono applicate da GKE.

GKE aggiorna automaticamente i valori delle quote delle risorse in proporzione al numero di nodi. Per i cluster con più di 100 nodi, GKErimuove la quota delle risorse.

Per esaminare le quote delle risorse, utilizza il seguente comando:

kubectl get resourcequota gke-resource-quotas -o yaml

Per visualizzare i valori per un determinato spazio dei nomi, specifica lo spazio dei nomi aggiungendo l'opzione --namespace.

Controllare la quota

Console

  1. Nella console Google Cloud, vai alla pagina Quote.

    Vai a Quote

  2. La pagina Quote mostra l'elenco delle quote prefiltrate in base alle quote di GKE.
  3. Per cercare la quota esatta, utilizza la tabella Filtra. Se non conosci il nome della quota, puoi utilizzare i link nella pagina Quote.

gcloud

  1. Per verificare le quote, esegui il comando seguente:
    gcloud compute project-info describe --project PROJECT_ID

    Sostituisci PROJECT_ID con l'ID del tuo progetto.

  2. Per verificare la quota utilizzata in un'area geografica, esegui questo comando:
    gcloud compute regions describe example-region

Note

  1. Il numero massimo di pod per cluster GKE Standard include i pod di sistema. Il numero di pod di sistema varia in base alla configurazione del cluster e alle funzionalità abilitate.

  2. Il numero massimo di pod che possono essere inseriti in un nodo dipende dalle dimensioni delle richieste di risorse dei pod e dalla capacità del nodo. Potresti non raggiungere tutti i limiti contemporaneamente. Come best practice, consigliamo di eseguire test di carico per implementazioni di grandi dimensioni.