Questa pagina è stata tradotta dall'API Cloud Translation.

Scalabilità

Questa pagina descrive le best practice per la creazione, la configurazione e l'utilizzo di cluster creati utilizzando Google Distributed Cloud (solo software) per VMware per gestire carichi di lavoro che si avvicinano ai limiti di scalabilità di Kubernetes.

Regole per i nomi dei cluster

Per ogni Google Cloud progetto:

Ogni cluster utente deve avere un nome univoco in tutti i cluster di amministrazione nell'ambito di un singolo progetto Google Cloud .

Limiti di scalabilità

Tieni conto dei seguenti limiti quando progetti le tue applicazioni:

Se il cluster avanzato non è abilitato:
- Ogni cluster di amministrazione supporta fino a 100 cluster utente, inclusi i cluster utente ad alta disponibilità e non ad alta disponibilità, utilizzando la modalità di bilanciamento del carico in bundle (MetalLB) o (bilanciatore del carico manuale).
- Ogni cluster utente supporta fino a:
  - 500 nodi che utilizzano la modalità di bilanciamento del carico in bundle (MetalLB)
  - 15.000 pod
  - 500 servizi LoadBalancer che utilizzano la modalità di bilanciamento del carico in bundle (MetalLB).
- Per ogni nodo, puoi creare un massimo di 110 pod (ogni pod può essere costituito da 1-2 container). Sono inclusi i pod che eseguono servizi di sistema aggiuntivi.
Se è abilitato il cluster avanzato
- Ogni cluster di amministrazione supporta fino a 100 cluster utente, che devono essere cluster ad alta disponibilità (HA), utilizzando la modalità di bilanciamento del carico in bundle (MetalLB) o (bilanciatore del carico manuale).
- Ogni cluster utente supporta fino a:
  - 500 nodi che utilizzano la modalità di bilanciamento del carico in bundle (MetalLB).
  - 15.000 pod
  - 500 servizi LoadBalancer che utilizzano la modalità di bilanciamento del carico in bundle (MetalLB).
- Per ogni nodo, puoi creare un massimo di 110 pod (ogni pod può essere costituito da 1-2 container). Sono inclusi i pod che eseguono servizi di sistema aggiuntivi.
- Il numero totale di nodi, che include i nodi del control plane del cluster di amministrazione + tutti i nodi del control plane del cluster utente + i nodi worker, non deve superare i 500 nodi.

Informazioni sui limiti

Poiché Google Distributed Cloud è un sistema complesso con un'ampia superficie di integrazione, la scalabilità del cluster coinvolge molte dimensioni intercorrelate. Ad esempio, Google Distributed Cloud può essere scalato in base al numero di nodi, pod o servizi. L'estensione di più di una dimensione alla volta può causare problemi anche nei cluster più piccoli. Ad esempio, la pianificazione di 110 pod per nodo in un cluster di 500 nodi può superare il numero di pod, pod per nodo e nodi.

Per ulteriori dettagli, consulta Soglie di scalabilità di Kubernetes.

I limiti di scalabilità sono sensibili anche alla configurazione di vSphere e all'hardware su cui è in esecuzione il cluster. Questi limiti vengono verificati in un ambiente probabilmente diverso dal tuo. Pertanto, potresti non riprodurre i numeri esatti quando l'ambiente sottostante è il fattore limitante.

Prepararsi alla scalabilità

Mentre ti prepari a scalare i cluster di amministrazione o i cluster utente, tieni presente i seguenti requisiti e limitazioni.

Requisiti di CPU, memoria e spazio di archiviazione

Consulta i requisiti di CPU, RAM e spazio di archiviazione per ogni singola VM.

Requisiti di I/O di disco e rete

I carichi di lavoro a uso intensivo di dati e alcuni componenti del piano di controllo sono sensibili alla latenza di I/O del disco e della rete. Ad esempio, per le prestazioni e la stabilità di etcd in un cluster con decine di nodi e migliaia di pod, sono in genere necessarie 500 IOPS sequenziali (ad esempio, un'unità SSD locale tipica o un dispositivo a blocchi virtualizzato ad alte prestazioni).

Indirizzo IP del nodo

Ogni nodo richiede un indirizzo IP DHCP o assegnato staticamente.

Ad esempio, in una configurazione con un cluster utente non HA con 50 nodi e un cluster utente HA con 250 nodi sono necessari 307 indirizzi IP.

La tabella seguente mostra la suddivisione degli indirizzi IP:

Tipo di nodo	Numero di indirizzi IP
VM del control plane del cluster di amministrazione	3
VM del control plane del cluster utente 1 (non ad alta disponibilità)	1
VM dei nodi worker del cluster utente 1	50
VM del control plane del cluster utente 2 (HA)	3
VM nodo worker del cluster utente 2	250
Totale	307

Esecuzione di molti cluster utente in un cluster di amministrazione

Quando ti prepari a eseguire molti cluster utente in un cluster di amministrazione, esegui i seguenti passaggi durante la creazione del cluster di amministrazione.

Blocco CIDR pod nel cluster di amministrazione

Il blocco CIDR dei pod è il blocco CIDR per tutti i pod in un cluster di amministrazione. Viene configurato tramite il campo network.podCIDR in admin-cluster.yaml.

Da questo intervallo, a ogni nodo vengono assegnati blocchi /24 più piccoli. Se tutti i tuoi cluster utente hanno Controlplane V2 abilitato, il cluster di amministrazione ha solo tre nodi e sono disponibili molti indirizzi IP pod. Tuttavia, ogni volta che crei un cluster utente che utilizza kubeception anziché Controlplane V2, al cluster di amministrazione vengono aggiunti uno o tre nodi:

Ogni cluster utente kubeception ad alta disponibilità (HA) aggiunge tre nodi al cluster di amministrazione.
Ogni cluster utente kubeception non HA aggiunge un nodo al cluster di amministrazione.

Se hai bisogno di un cluster di amministrazione con N nodi, devi assicurarti che il blocco CIDR dei pod sia abbastanza grande da supportare N /24 blocchi.

La tabella seguente descrive il numero massimo di nodi supportati da diverse dimensioni del blocco CIDR pod:

Dimensione del blocco CIDR pod	Numero massimo di nodi supportati
/18	64
/17	128
/16	256
/15	512

Il blocco CIDR dei pod predefinito di un cluster di amministrazione è 192.168.0.0/16, che supporta 256 nodi.

In un cluster di amministrazione con 100 cluster utente kubeception HA, ci sono 3 nodi del control plane del cluster di amministrazione e 300 nodi del control plane del cluster utente. Il numero totale di nodi è 303 (più di 256). Pertanto, devi aggiornare il blocco CIDR del pod a /15 per supportare fino a 100 cluster utente kubeception HA.

Per configurare il blocco CIDR pod, imposta il campo network.podCIDR nel file di configurazione del cluster di amministrazione.

Blocco CIDR del servizio nel cluster di amministrazione

Il blocco CIDR del servizio è il blocco CIDR per tutti i servizi in un cluster di amministrazione. Viene configurato tramite il campo network.serviceCIDR in admin-cluster.yaml.

La tabella seguente descrive il numero massimo di servizi supportati da diverse dimensioni del blocco CIDR del servizio:

Dimensione del blocco CIDR servizio	Numero massimo di servizi supportati
/24	256
/23	512
/22	1024

Il valore predefinito è 10.96.232.0/24, che supporta 256 servizi.

Ogni cluster utente kubeception utilizza 6 servizi e il control plane del cluster di amministrazione ne utilizza 14. Pertanto, per eseguire 100 cluster utente kubeception, devi modificare il blocco CIDR del servizio nel cluster di amministrazione in modo che utilizzi un intervallo /22.

Cloud Logging e Cloud Monitoring per i cluster utente kubeception

Cloud Logging e Cloud Monitoring ti aiutano a monitorare le risorse.

L'utilizzo di CPU e memoria dei componenti di logging e monitoraggio di cui è stato eseguito il deployment in un cluster di amministrazione viene scalato in base al numero di cluster utente kubeception.

La tabella seguente descrive la quantità di CPU e memoria dei nodi del cluster di amministrazione necessaria per eseguire un numero elevato di cluster utente kubeception:

Numero di cluster utente kubeception	CPU del nodo del cluster di amministrazione	Memoria del nodo del cluster di amministrazione
Da 0 a 10	4 CPU	16 GB
Da 11 a 20	4 CPU	32 GB
Da 20 a 100	4 CPU	90GB

Ad esempio, se ci sono 2 nodi del cluster di amministrazione e ognuno ha 4 CPU e 16 GB di memoria, puoi eseguire da 0 a 10 cluster utente kubeception. Per creare più di 20 cluster utente kubeception, devi prima ridimensionare la memoria dei nodi del cluster di amministrazione da 16 GB a 90 GB.

Nodi del cluster di amministrazione quando sono abilitati i cluster avanzati

L'utilizzo di CPU e memoria dei componenti del ciclo di vita di cui è stato eseguito il deployment in un cluster di amministrazione viene scalato in base al numero totale di tutti i nodi (il numero totale di nodi che include i nodi del control plane del cluster di amministrazione + tutti i nodi del control plane del cluster utente + i nodi worker).

La tabella seguente descrive la quantità di CPU e memoria del nodo del cluster di amministrazione necessaria per eseguire un numero elevato di tutti i nodi che gestisce:

Numero totale di nodi	CPU del nodo del cluster di amministrazione	Memoria del nodo del cluster di amministrazione
Da 0 a 20	4 CPU	16 GB
Da 21 a 100	8 CPU	16 GB
Da 101 a 500	16 CPU	32 GB

Ad esempio, se ci sono 3 nodi del cluster di amministrazione e ognuno ha 4 CPU e 16 GB di memoria, puoi eseguire un cluster utente HA con 14 nodi worker. Per creare più di 20 cluster utente avanzati, ognuno con più di 10 nodi, devi prima ridimensionare la memoria dei nodi del cluster di amministrazione da 16 GB a 32 GB.

GKE Hub

Per impostazione predefinita, puoi registrare un massimo di 250 cluster con appartenenze globali per parco risorse. Per registrare più cluster in GKE Hub, puoi inviare una richiesta per aumentare la tua quota nella console Google Cloud :

Vai a Quote

Per saperne di più sulle quote dei cluster in base alle impostazioni di appartenenza, consulta Quote di allocazione.

Esecuzione di molti nodi e pod in un cluster utente

Quando ti prepari a eseguire molti nodi e pod in un cluster utente, esegui i seguenti passaggi durante la creazione del cluster utente.

Blocco CIDR pod nel cluster utente

Il blocco CIDR dei pod è il blocco CIDR per tutti i pod di un cluster utente. Viene configurato tramite il campo network.podCIDR in user-cluster.yaml.

Da questo intervallo, a ogni nodo viene assegnato un blocco /24 più piccolo. Se hai bisogno di un cluster con N nodi, devi assicurarti che questo blocco sia sufficientemente grande da supportare N blocchi /24.

La tabella seguente descrive il numero massimo di nodi supportati da diverse dimensioni del blocco CIDR pod:

Dimensione del blocco CIDR pod	Numero massimo di nodi supportati
/18	64
/17	128
/16	256
/15	512

Il blocco CIDR dei pod predefinito è 192.168.0.0/16, che supporta 256 nodi. Ad esempio, per creare un cluster con 500 nodi, devi modificare il blocco CIDR dei pod nel cluster utente in modo che utilizzi un intervallo /15.

Blocco CIDR del servizio nel cluster utente

Il blocco CIDR del servizio è il blocco CIDR per tutti i servizi in un cluster utente. Viene configurato tramite il campo network.serviceCIDR in user-cluster.yaml.

La tabella seguente descrive il numero massimo di servizi supportati da diverse dimensioni del blocco CIDR del servizio:

Dimensione del blocco CIDR servizio	Numero massimo di servizi supportati
/21	2048
/20	4096
/19	8192
/18	16.384

Nodi del control plane del cluster utente

L'utilizzo di memoria dei componenti del control plane del cluster utente viene scalato in base al numero di nodi nel cluster utente.

La seguente tabella indica la CPU e la memoria richieste da un nodo del control plane di un cluster utente a seconda delle dimensioni del cluster utente:

Numero di nodi del cluster utente	CPU del nodo del control plane	Memoria del nodo del control plane
Da 0 a 20	3 CPU	5 GB
da 21 a 75	3 CPU	6GB
Da 76 a 250	4 CPU	8 GB
Da 251 a 500	4 CPU	16 GB

Ad esempio, per creare più di 250 nodi in un cluster utente, devi utilizzare nodi del control plane del cluster utente con almeno 16 GB di memoria.

La specifica del nodo del control plane del cluster utente può essere modificata tramite il campo masterNode in user-cluster.yaml.

Dataplane V2

Per i cluster utente con 500 nodi che utilizzano Dataplane V2, consigliamo 120 GB di memoria e 32 core CPU per i nodi del control plane del cluster utente.

Cloud Logging e Cloud Monitoring

Cloud Logging e Cloud Monitoring ti aiutano a monitorare le risorse.

L'utilizzo di CPU e memoria degli agenti in-cluster di cui è stato eseguito il deployment in un cluster utente fare lo scale inn base al numero di nodi e pod in un cluster utente.

I componenti di logging e monitoraggio di Cloud come prometheus-server e stackdriver-prometheus-sidecar hanno un utilizzo diverso delle risorse di CPU e memoria in base al numero di nodi e di pod. Prima di scalare il cluster, imposta la richiesta e il limite di risorse in base all'utilizzo medio stimato di questi componenti. La seguente tabella mostra le stime della quantità media di utilizzo per ogni componente:

Numero di nodi	Nome container	Utilizzo CPU stimato		Utilizzo stimato della memoria
Numero di nodi	Nome container	0 pod/nodo	30 pod/nodo	0 pod/nodo	30 pod/nodo
Da 3 a 50	prometheus-server	100m	390m	650 milioni	1.3G
Da 3 a 50	stackdriver-prometheus-sidecar	100m	340m	1,5 G	1,6 G
Da 51 a 100	prometheus-server	160m	500m	1,8 G	5.5G
Da 51 a 100	stackdriver-prometheus-sidecar	200m	500m	1,9 G	5,7 G
Da 101 a 250	prometheus-server	400m	2500m	6,5 G	16G
Da 101 a 250	stackdriver-prometheus-sidecar	400m	1300m	7,5 G	12G
Da 250 a 500	prometheus-server	1200m	2600m	22G	25G
Da 250 a 500	stackdriver-prometheus-sidecar	400m	2250m	65G	78G

Assicurati di avere nodi abbastanza grandi per pianificare i componenti Cloud Logging e Cloud Monitoring. Un modo per farlo è creare prima un piccolo cluster, modificare le risorse dei componenti Cloud Logging e Cloud Monitoring in base alla tabella precedente, creare un pool di nodi per ospitare i componenti e poi aumentare gradualmente le dimensioni del cluster.

Puoi scegliere di mantenere un pool di nodi abbastanza grande per i componenti di monitoraggio e logging per impedire la pianificazione di altri pod nel pool di nodi. A questo scopo, devi aggiungere i seguenti taint al pool di nodi:

taints:
  - effect: NoSchedule
    key: node-role.gke.io/observability

In questo modo, altri componenti non vengono pianificati nel pool di nodi e i carichi di lavoro utente non vengono eliminati a causa del consumo di risorse dei componenti di monitoraggio.

Bilanciatore del carico

I servizi descritti in questa sezione si riferiscono ai servizi Kubernetes di tipo LoadBalancer.

Esiste un limite al numero di nodi nel cluster e al numero di servizi che puoi configurare sul bilanciatore del carico.

Per il bilanciamento del carico in bundle (Seesaw), esiste anche un limite al numero di controlli di integrità. Il numero di controlli di integrità dipende dal numero di nodi e dal numero di servizi locali di gestione del traffico. Un servizio di traffico locale è un servizio il cui externalTrafficPolicy è impostato su Local.

La tabella seguente descrive il numero massimo di servizi, nodi e controlli di integrità per il bilanciamento del carico in bundle (Seesaw) e il bilanciamento del carico integrato (F5):

	Bilanciamento del carico in bundle (Seesaw)	Bilanciamento del carico integrato (F5)
Max Services	500	250 ²
N. massimo di nodi	500	250 ²
Controlli di integrità massimi	N + (L * N) <= 10.000, dove N è il numero di nodi e L è il numero di servizi locali di traffico ¹	N/A ²

¹ Ad esempio, supponiamo di avere 100 nodi e 99 servizi locali di traffico. Il numero di controlli di integrità è 100 + (99 * 100) = 10.000, che rientra nel limite di 10.000.

² Per ulteriori informazioni, consulta F5. Questo numero è influenzato da fattori come il numero di modello dell'hardware F5, la CPU/la memoria dell'istanza virtuale e le licenze.

Componenti di sistema di scalabilità automatica

Google Distributed Cloud scala automaticamente i componenti di sistema nei cluster utente in base al numero di nodi senza che tu debba modificare le configurazioni. Puoi utilizzare le informazioni in questa sezione per la pianificazione delle risorse.

Google Distributed Cloud esegue automaticamente lo scale verticale scalando le richieste/i limiti di CPU e memoria dei seguenti componenti di sistema utilizzando addon-resizer:
- kube-state-metrics è un deployment in esecuzione sui nodi worker del cluster che ascolta il server API Kubernetes e genera metriche sullo stato degli oggetti. Le richieste e i limiti di CPU e memoria vengono scalati in base al numero di nodi.
  
  La tabella seguente descrive le richieste/i limiti di risorse impostati dal sistema, dato il numero di nodi in un cluster:
  
  Numero di nodi Richiesta/limite CPU (milli)¹ approssimativo Richiesta/limite di memoria¹ approssimativo (Mi)
  
  Da 3 a 5 105 110
  
  Da 6 a 500 100 + num_nodi 100 + (2 * num_nodi)
  
  ¹ Esiste un margine di +-5% per ridurre il numero di riavvii dei componenti durante lo scaling.
  
  Ad esempio, in un cluster con 50 nodi, la richiesta/il limite di CPU sono impostati su 150 m/150 m e la richiesta/il limite di memoria sono impostati su 200 Mi/200 Mi. In un cluster con 250 nodi, la richiesta/il limite di CPU sono impostati su 350 m/350 m e la richiesta/il limite di memoria sono impostati su 600 Mi.
- metrics-server è un deployment in esecuzione sui nodi worker del cluster utilizzato dalle pipeline di scalabilità automatica integrate di Kubernetes. La richiesta e i limiti di CPU e memoria vengono scalati in base al numero di nodi.

Numero di nodi	Richiesta/limite CPU (milli)¹ approssimativo	Richiesta/limite di memoria¹ approssimativo (Mi)
Da 3 a 5	105	110
Da 6 a 500	100 + num_nodi	100 + (2 * num_nodi)

Google Distributed Cloud esegue automaticamente lo scaling orizzontale sia nei cluster di amministrazione sia nei cluster utente scalando il numero di repliche dei seguenti componenti di sistema:

core-dns è la soluzione DNS utilizzata per la Service Discovery. Viene eseguito come deployment sui nodi worker del cluster utente. Google Distributed Cloud scala automaticamente il numero di repliche in base al numero di nodi e core CPU nel cluster. Con ogni aggiunta/eliminazione di 16 nodi o 256 core, una replica viene aumentata/diminuita. Se hai un cluster di N nodi e C core, puoi aspettarti max(N/16, C/256) repliche.
calico-typha è un componente per il supporto del networking dei pod. Viene eseguito come deployment sui nodi worker del cluster utente. Google Distributed Cloud scala automaticamente il numero di repliche di calico-typha in base al numero di nodi nel cluster:

Numero di nodi (N) Numero di repliche di calico-typha

N = 1 1
1 < N < 200 2
N >= 200 3 o più
Istio ingress-gateway è il componente per supportare l'ingresso del cluster e viene eseguito come Deployment sui nodi worker del cluster utente. A seconda della quantità di traffico gestita da ingress-gateway, Google Distributed Cloud utilizza Horizontal Pod Autoscaler per scalare il numero di repliche in base all'utilizzo della CPU, con un minimo di 2 repliche e un massimo di 5 repliche.

Numero di nodi (N)	Numero di repliche di calico-typha
N = 1	1
1 < N < 200	2
N >= 200	3 o più

Il proxy di rete konnectivity (KNP) fornisce un proxy a livello TCP per l'uscita dai nodi del control plane del cluster utente. Esegue il tunneling del traffico in uscita di kube-apiserver dell'utente destinato ai nodi del cluster utente. L'agente Konnectivity viene eseguito come Deployment sui nodi worker del cluster utente. Google Distributed Cloud scala automaticamente il numero di repliche dell'agente konnectivity in base al numero di nodi nel cluster.

Numero di nodi (N)	Numero di repliche dell'agente di connettività
1 <= N <= 6	N
6 < N < 10	6
10 <= N < 100	8
N >= 100	12 o più

Best practice

Questa sezione descrive le best practice per scalare le risorse.

Scalare il cluster in più fasi

La creazione di un nodo Kubernetes comporta la clonazione del modello di immagine sistema operativo del nodo in un nuovo file disco, che è un'operazione vSphere a elevato utilizzo di I/O. Non esiste isolamento I/O tra l'operazione di clonazione e le operazioni I/O del carico di lavoro. Se vengono creati troppi nodi contemporaneamente, le operazioni di clonazione richiedono molto tempo per essere completate e potrebbero influire sulle prestazioni e sulla stabilità del cluster e dei workload esistenti.

Assicurati che il cluster venga scalato in fasi a seconda delle risorse vSphere. Ad esempio, per ridimensionare un cluster da 3 a 500 nodi, valuta la possibilità di scalare in più fasi, da 150 a 350 a 500, il che contribuisce a ridurre il carico sull'infrastruttura vSphere.

Ottimizza le prestazioni di I/O disco di etcd

etcd è un archivio di coppia chiave-valore utilizzato come archivio di backup di Kubernetes per tutti i dati del cluster. Le sue prestazioni e la sua stabilità sono fondamentali per l'integrità di un cluster e sono sensibili alla latenza I/O di disco e rete.

Ottimizza il rendimento I/O del datastore vSphere utilizzato per le VM del control plane seguendo questi consigli:
- Segui i requisiti hardware di etcd.
- Utilizza SSD o spazio di archiviazione all-flash.
Una latenza di qualche centinaio di millisecondi indica un collo di bottiglia sull'I/O del disco o della rete e potrebbe comportare un cluster non integro. Monitora e imposta le soglie di avviso per le seguenti metriche di latenza I/O di etcd:
- etcd_disk_backend_commit_duration_seconds
- etcd_disk_wal_fsync_duration_seconds

Ottimizza le prestazioni I/O del disco di avvio del nodo

I pod utilizzano lo spazio di archiviazione temporanea per le loro operazioni interne, come il salvataggio di file temporanei. Lo spazio di archiviazione temporaneo viene utilizzato dal livello scrivibile del container, dalla directory dei log e dai volumi emptyDir. L'archiviazione temporanea proviene dal file system del nodo, che è supportato dal disco di avvio del nodo.

Poiché non esiste un isolamento I/O di archiviazione sui nodi Kubernetes, le applicazioni che consumano I/O estremamente elevati sull'archiviazione temporanea possono potenzialmente causare instabilità del nodo privando di risorse i componenti di sistema come Kubelet e il daemon Docker.

Assicurati che le caratteristiche di rendimento I/O del datastore su cui vengono sottoposti a provisioning i dischi di avvio possano fornire il rendimento giusto per l'utilizzo dello spazio di archiviazione temporaneo e del traffico di logging dell'applicazione.

Monitorare la contesa delle risorse fisiche

Tieni presente i rapporti tra vCPU e pCPU e l'overcommitment della memoria. Un rapporto non ottimale o una contesa di memoria sugli host fisici può causare un degrado delle prestazioni della VM. Devi monitorare l'utilizzo delle risorse fisiche a livello di host e allocare risorse sufficienti per eseguire i cluster di grandi dimensioni.