Un requisito normativo comune è che un'azienda sia in grado di dimostrare la propria capacità di ripristino di emergenza (RE). Per le applicazioni eseguite nel cloud, questo requisito include l'affidabilità e la disponibilità dei servizi quando i server ospitati in una zona non sono più disponibili per un determinato periodo di tempo. Questo documento è rivolto ad amministratori e architetti, operatori e amministratori di backup e ripristino di emergenza (RE) che vogliono imparare a simulare un failover di una zona quando si utilizza un cluster a livello di regione Google Kubernetes Engine (GKE) Standard.
I cluster GKE a livello di regione vengono creati in una regione scelta dall'utente ed eseguono il piano di controllo sulle VM situate in più zone all'interno della regione scelta. I cluster GKE Autopilot sono sempre a livello di regione, mentre i cluster GKE Standard possono essere a livello di regione o di zona. Questo tutorial utilizza un cluster a livello di regione di GKE Standard. I nodi del cluster comunicano con il piano di controllo tramite un bilanciatore del carico, il che significa che la località del nodo e quella della VM del piano di controllo non sempre corrispondono. Nella console Google Cloud non puoi disabilitare una zona specifica quando utilizzi un cluster a livello di regione. Per ulteriori informazioni, consulta Architettura dei cluster GKE.
Questo tutorial fornisce tre metodi diversi per simulare gli errori di zona. Puoi simulare un errore di una zona e verificare la risposta corretta dell'applicazione utilizzando il metodo richiesto per i tuoi scopi di conformità.
I metodi descritti in questo documento si applicano anche ai cluster a livello di zona, inclusi quelli a zona singola e multi-zona. Questi metodi interessano solo i nodi nelle zone target, senza influire sul piano di controllo GKE.
Obiettivi
- Crea un cluster GKE Standard a livello di regione utilizzando la configurazione predefinita.
- Esegui il deployment di un'applicazione di microservizi di esempio nel cluster a livello di regione.
- Simula un'interruzione di zona utilizzando uno dei seguenti tre metodi:
- Riduci le zone del pool di nodi in un cluster a livello di regione.
- Utilizza un pool di nodi a zona singola.
- Non pianificarlo ed svuotare i nodi della zona di errore di destinazione.
- Verifica la disponibilità dei microservizi.
Costi
Questo tutorial utilizza i seguenti componenti fatturabili di Google Cloud:
- Compute Engine
- Cluster in modalità GKE Standard
Utilizza il Calcolatore prezzi per generare una stima dei costi in base all'utilizzo previsto.
Prima di iniziare
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
- Installa Google Cloud CLI.
-
Per initialize gcloud CLI, esegui questo comando:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API Kubernetes Engine API, Compute Engine.
gcloud services enable container.googleapis.com
compute.googleapis.com - Installa Google Cloud CLI.
-
Per initialize gcloud CLI, esegui questo comando:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
-
Abilita le API Kubernetes Engine API, Compute Engine.
gcloud services enable container.googleapis.com
compute.googleapis.com
Crea un cluster Standard a livello di regione
Prima di simulare un errore di zona, crea un cluster a livello di regione con un pool di nodi multizona. Il piano di controllo e i nodi del cluster vengono replicati su più zone nella regione specificata.
Utilizza Google Cloud CLI per creare il cluster:
Crea un nuovo cluster GKE Standard utilizzando la configurazione predefinita:
gcloud container clusters create CLUSTER_NAME \ --region REGION \ --num-nodes 2
Sostituisci i seguenti parametri:
CLUSTER_NAME
: il nome del cluster.REGION
: la regione per il tuo cluster, ad esempious-central1
.
GKE richiede pochi minuti per creare il cluster e verificare che tutto funzioni correttamente. Vengono creati due nodi in ciascuna zona della regione specificata.
Controlla le zone di ciascun nodo creato nel passaggio precedente:
kubectl get node -o=custom-columns='NAME:.metadata.name,ZONE:.metadata.labels.topology\.kubernetes\.io/zone,INT_IP:.status.addresses[0].address'
L'output è simile all'esempio seguente:
NAME ZONE INT_IP regional-cluster-1-default-pool-node1 asia-southeast1-c 10.128.0.37 regional-cluster-1-default-pool-node2 asia-southeast1-c 10.128.0.36 regional-cluster-1-default-pool-node3 asia-southeast1-b 10.128.0.38 regional-cluster-1-default-pool-node4 asia-southeast1-b 10.128.0.33 regional-cluster-1-default-pool-node5 asia-southeast1-a 10.128.0.35 regional-cluster-1-default-pool-node6 asia-southeast1-a 10.128.0.34
Connettiti al cluster:
gcloud container clusters get-credentials CLUSTER_NAME \ --region REGION
Esegui il deployment di un'applicazione di microservizi di esempio
Per vedere l'effetto del failover simulato in questo documento, esegui il deployment di un'applicazione di esempio basata su microservizi nel cluster. In questo documento, utilizza l'esempio di richiesta di Cymbal Bank:
Nella shell, clona il seguente repository GitHub e passa alla directory:
git clone https://github.com/GoogleCloudPlatform/bank-of-anthos.git cd bank-of-anthos/
Esegui il deployment dell'applicazione di esempio Cymbal Bank nel cluster GKE che hai creato nella sezione precedente:
kubectl apply -f ./extras/jwt/jwt-secret.yaml kubectl apply -f ./kubernetes-manifests
Attendi che i pod siano pronti:
kubectl get pods
Dopo alcuni minuti, dovresti vedere i pod nello stato
Running
:NAME READY STATUS RESTARTS AGE accounts-db-0 1/1 Running 0 16s balancereader-7dc7d9ff57-sstm5 0/1 Running 0 15s contacts-7ddc76d94-rr28x 0/1 Running 0 14s frontend-747b84bff4-2mtlv 0/1 Running 0 13s ledger-db-0 1/1 Running 0 13s ledgerwriter-f6cc7889d-9qjfg 0/1 Running 0 13s loadgenerator-57d4cb57cc-zqvqb 1/1 Running 0 13s transactionhistory-5dd7c7fd77-lwkv8 0/1 Running 0 12s userservice-cd5ddb4bb-wwhml 0/1 Running 0 12s
Quando i pod sono tutti in stato
Running
, ottieni l'indirizzo IP esterno del servizio frontend:kubectl get service frontend | awk '{print $4}'
In una finestra del browser web, apri l'indirizzo IP visualizzato nell'output del comando
kubectl get service
per accedere alla tua istanza di Cymbal Bank.Le credenziali predefinite vengono compilate automaticamente, quindi puoi accedere all'app ed esplorare alcune delle transazioni e dei saldi di esempio. Non ci sono azioni specifiche da intraprendere, se non per verificare che Cymbal Bank funzioni correttamente. Potrebbero essere necessari un paio di minuti affinché tutti i servizi vengano avviati correttamente e ti permetta di accedere. Attendi che tutti i pod siano nello stato
Running
e di poter accedere al sito di Cymbal Bank prima di passare alla sezione successiva e simulare un errore di zona.
Simulare un errore di zona
In questa sezione simulerai un guasto in una delle zone. Esistono tre modi diversi per simulare questo failover. Devi scegliere un solo metodo. Simula un errore di zona e verifica la risposta corretta dell'applicazione utilizzando il metodo richiesto per i tuoi scopi di conformità.
Riduci le zone del pool di nodi
Per impostazione predefinita, un pool di nodi di un cluster a livello di regione contiene nodi distribuiti su tutte le zone della regione. Nel diagramma seguente, Cloud Load Balancing distribuisce il traffico a un pool di nodi che comprende tre zone. Ogni zona ha due nodi e i pod possono essere eseguiti nei nodi di queste zone.
In questa sezione simulerai un errore di zona aggiornando il pool di nodi in modo che venga eseguito solo in due zone su tre. Questo approccio verifica che l'applicazione possa rispondere alla perdita di una zona ridistribuendo correttamente i pod e il traffico tra le altre zone.
Per aggiornare il pool di nodi in modo che venga eseguito solo in determinate zone e simulare l'errore, completa questi passaggi:
Controlla la disponibilità di cluster e servizi a livello di regione:
kubectl get po -o wide \ kubectl get node -o=custom-columns='NAME:.metadata.name,ZONE:.metadata.labels.topology\.kubernetes\.io/zone,INT_IP:.status.addresses[0].address'
Il risultato è simile al seguente output di esempio:
NAME READY STATUS RESTARTS AGE IP NODE accounts-db-0 1/1 Running 0 6m30s 10.28.1.5 regional-cluster-1-default-pool-node3 balancereader-7dc7d9ff57-shwg5 1/1 Running 0 6m30s 10.28.5.6 regional-cluster-1-default-pool-node1 contacts-7ddc76d94-qv4x5 1/1 Running 0 6m29s 10.28.4.6 regional-cluster-1-default-pool-node2 frontend-747b84bff4-xvjxq 1/1 Running 0 6m29s 10.28.3.6 regional-cluster-1-default-pool-node6 ledger-db-0 1/1 Running 0 6m29s 10.28.5.7 regional-cluster-1-default-pool-node1 ledgerwriter-f6cc7889d-mttmb 1/1 Running 0 6m29s 10.28.1.6 regional-cluster-1-default-pool-node3 loadgenerator-57d4cb57cc-7fvrc 1/1 Running 0 6m29s 10.28.4.7 regional-cluster-1-default-pool-node2 transactionhistory-5dd7c7fd77-cmc2w 1/1 Running 0 6m29s 10.28.3.7 regional-cluster-1-default-pool-node6 userservice-cd5ddb4bb-zfr2g 1/1 Running 0 6m28s 10.28.5.8 regional-cluster-1-default-pool-node1 NAME ZONE INT_IP regional-cluster-1-default-pool-node5 asia-southeast1-c 10.148.0.6 regional-cluster-1-default-pool-node6 asia-southeast1-c 10.148.0.7 regional-cluster-1-default-pool-node2 asia-southeast1-a 10.148.0.8 regional-cluster-1-default-pool-node1 asia-southeast1-a 10.148.0.9 regional-cluster-1-default-pool-node3 asia-southeast1-b 10.148.0.5 regional-cluster-1-default-pool-node4 asia-southeast1-b 10.148.0.4
In questo esempio, il deployment di tutti i carichi di lavoro di Cymbal Bank viene eseguito in tutte le zone. Per simulare un errore, disabilita una delle zone, ad esempio
asia-southeast1-c
, in cui viene eseguito il deployment del servizio frontend.Simulare un'interruzione di una zona. Aggiorna il pool di nodi esistente (
default-pool
) per specificare solo due zone delle tre zone:gcloud container node-pools update default-pool \ --cluster=CLUSTER_NAME \ --node-locations=ZONE_A, ZONE_B \ --region=REGION
Sostituisci
ZONE_A, ZONE_B
con le due zone in cui vuoi che il pool di nodi continui a funzionare.Verifica la disponibilità dei microservizi dopo aver aggiornato il pool di nodi:
kubectl get po -o wide kubectl get node -o=custom-columns='NAME:.metadata.name,ZONE:.metadata.labels.topology\.kubernetes\.io/zone,INT_IP:.status.addresses[0].address'
L'output dovrebbe essere simile all'esempio seguente:
NAME ZONE INT_IP regional-cluster-1-default-pool-node2 asia-southeast1-a 10.148.0.8 regional-cluster-1-default-pool-node1 asia-southeast1-a 10.148.0.9 regional-cluster-1-default-pool-node3 asia-southeast1-b 10.148.0.5 regional-cluster-1-default-pool-node4 asia-southeast1-b 10.148.0.4 NAME READY STATUS RESTARTS AGE IP NODE accounts-db-0 1/1 Running 0 28m 10.28.1.5 regional-cluster-1-default-pool-node3 balancereader-7dc7d9ff57-shwg5 1/1 Running 0 28m 10.28.5.6 regional-cluster-1-default-pool-node1 contacts-7ddc76d94-qv4x5 1/1 Running 0 28m 10.28.4.6 regional-cluster-1-default-pool-node2 frontend-747b84bff4-mdnkd 1/1 Running 0 9m21s 10.28.1.7 regional-cluster-1-default-pool-node3 ledger-db-0 1/1 Running 0 28m 10.28.5.7 regional-cluster-1-default-pool-node1 ledgerwriter-f6cc7889d-mttmb 1/1 Running 0 28m 10.28.1.6 regional-cluster-1-default-pool-node3 loadgenerator-57d4cb57cc-7fvrc 1/1 Running 0 28m 10.28.4.7 regional-cluster-1-default-pool-node2 transactionhistory-5dd7c7fd77-w2vqs 1/1 Running 0 9m20s 10.28.4.8 regional-cluster-1-default-pool-node2 userservice-cd5ddb4bb-zfr2g 1/1 Running 0 28m 10.28.5.8 regional-cluster-1-default-pool-node1
In questo output di esempio,
asia-southeast1-c
non è più in uso. Il servizio frontend a cui accedi da un browser con l'URLhttp://EXTERNAL_IP
è ancora accessibile. Un utente potrà comunque eseguire azioni di deposito e pagamento, anche se una delle zone non è più disponibile.
Utilizza un pool di nodi a zona singola
In questa sezione simulerai un errore di zona eliminando due pool di nodi. Questo approccio verifica che la tua applicazione possa rispondere alla perdita di un pool di nodi ridistribuendo correttamente i pod e il traffico in un pool di nodi in un'altra zona. Per simulare un'interruzione di una zona su un cluster a livello di regione, espandi il cluster di base creato in precedenza, eseguendo l'applicazione Cymbal Bank su più pool di nodi. Questo metodo di simulazione dell'interruzione della zona riflette più da vicino un errore di zona effettivo rispetto al primo esempio di aggiornamento delle zone attive in un pool di nodi, poiché è più comune la presenza di più pool di nodi in un cluster:
Il cluster che crei in questa sezione per simulare un errore del pool di nodi a zona singola include i seguenti componenti:
Pool di nodi predefinito, di solito creato quando crei un cluster GKE Standard a livello di regione, è un pool di nodi multi-zona (
default-pool
).Questo cluster con il singolo
default-pool
è quello che hai creato in precedenza in questo documento.Pool di nodi aggiuntivi (
zonal-node-pool-1
ezonal-node-pool-2
) che eseguono anche servizi per l'applicazione Cymbal Bank di esempio.
Le linee tratteggiate nel diagramma mostrano in che modo il traffico pubblica solo zonal-node-pool-2
dopo aver simulato un errore in default-pool
e zonal-node-pool-1
.
Per creare pool di nodi aggiuntivi e simulare l'errore, completa questi passaggi:
Verifica la disponibilità del cluster a livello di regione:
gcloud container node-pools list \ --cluster=CLUSTER_NAME \ --region REGION kubectl get node -o=custom-columns='NAME:.metadata.name,ZONE:.metadata.labels.topology\.kubernetes\.io/zone,INT_IP:.status.addresses[0].address'
Il risultato è simile al seguente output di esempio:
NAME: default-pool MACHINE_TYPE: e2-medium DISK_SIZE_GB: 100 NODE_VERSION: 1.27.8-gke.1067004 NAME ZONE. INT_IP regional-cluster-1-default-pool-node5-pzmc asia-southeast1-c 10.148.0.6 regional-cluster-1-default-pool-node6-qf1l asia-southeast1-c 10.148.0.7 regional-cluster-1-default-pool-node2-dlk2 asia-southeast1-a 10.148.0.8 regional-cluster-1-default-pool-node1-pkfd asia-southeast1-a 10.148.0.9 regional-cluster-1-default-pool-node3-6b6n asia-southeast1-b 10.148.0.5 regional-cluster-1-default-pool-node4-h0lc asia-southeast1-b 10.148.0.4
In questo output di esempio, il deployment di tutti i pod di Cymbal Bank viene eseguito in tutte le zone dello stesso cluster e vengono eseguiti nell'elemento
default-pool
esistente.Crea due nuovi pool di nodi a zona singola:
gcloud beta container node-pools create zonal-node-pool-1 \ --cluster CLUSTER_NAME \ --region REGION \ --num-nodes 4 \ --node-locations ZONE_A gcloud beta container node-pools create zonal-node-pool-2 \ --cluster CLUSTER_NAME \ --region REGION \ --num-nodes 4 \ --node-locations ZONE_B
Sostituisci
ZONE_A
eZONE_B
con le due zone in cui vuoi che vengano eseguiti i nuovi pool di nodi a zona singola.Per simulare un errore di zona, elimina il pool di nodi a livello di regione
default-pool
e uno dei nuovi pool di nodi a zona singola:gcloud container node-pools delete default-pool \ --cluster=CLUSTER_NAME \ --region=REGION gcloud container node-pools delete zonal-node-pool-1 \ --cluster=CLUSTER_NAME \ --region=REGION
Durante il processo di eliminazione di
node-pool
, i carichi di lavoro vengono arrestati e ripianificati su un altro pool di nodi disponibile. Quando si verifica questa procedura, i servizi e i deployment non sono disponibili. Questo comportamento significa che è necessario specificare le finestre di tempo di inattività per i report o la documentazione di RE.Verifica la continua disponibilità dei microservizi:
kubectl get po -o wide \ kubectl get node -o=custom-columns='NAME:.metadata.name,ZONE:.metadata.labels.topology\.kubernetes\.io/zone,INT_IP:.status.addresses[0].address'
L'output dovrebbe essere simile all'esempio seguente:
NAME ZONE INT_IP regional-cluster-1-node-pool3-node1 asia-southeast1-b 10.148.0.8 regional-cluster-1-node-pool3-node2 asia-southeast1-b 10.148.0.9 regional-cluster-1-node-pool3-node3 asia-southeast1-b 10.148.0.5 regional-cluster-1-node-pool3-node4 asia-southeast1-b 10.148.0.4 NAME READY STATUS RESTARTS AGE IP NODE accounts-db-0 1/1 Running 0 28m 10.28.1.5 regional-cluster-1-zonal-node-pool-2-node3 balancereader-7dc7d9ff57-shwg5 1/1 Running 0 28m 10.28.5.6 regional-cluster-1-zonal-node-pool-2-node1 contacts-7ddc76d94-qv4x5 1/1 Running 0 28m 10.28.4.6 regional-cluster-1-zonal-node-pool-2-node2 frontend-747b84bff4-mdnkd 1/1 Running 0 9m21s 10.28.1.7 regional-cluster-1-zonal-node-pool-2-node3 ledger-db-0 1/1 Running 0 28m 10.28.5.7 regional-cluster-1-zonal-node-pool-2-node4 ledgerwriter-f6cc7889d-mttmb 1/1 Running 0 28m 10.28.1.6 regional-cluster-1-zonal-node-pool-2-node3 loadgenerator-57d4cb57cc-7fvrc 1/1 Running 0 28m 10.28.4.7 regional-cluster-1-zonal-node-pool-2-node2 transactionhistory-5dd7c7fd77-w2vqs 1/1 Running 0 9m20s 10.28.4.8 regional-cluster-1-zonal-node-pool-2-node2 userservice-cd5ddb4bb-zfr2g 1/1 Running 0 28m 10.28.5.8 regional-cluster-1-zonal-node-pool-2-node1
In questo output di esempio, poiché
default-pool
ezonal-node-pool-1
non esistono più, tutti i servizi vengono eseguiti inzonal-node-pool-2
.
Contrassegna come pianificabile e svuota i nodi di una zona
In questa sezione, contrassegnando come non pianificabili e svuotano nodi specifici nel cluster. Contrassegna come non pianificabile e svuota tutti i nodi in una singola zona, simulando la perdita dei pod in esecuzione su questi nodi nella zona:
In questo diagramma, coordina e svuota i nodi della prima zona. I nodi nelle altre due zone continuano a essere eseguiti. Questo approccio verifica che la tua applicazione possa rispondere alla perdita di tutti i nodi in una zona, ridistribuendo correttamente i pod e il traffico tra i nodi in esecuzione in altre zone.
Per contrassegnare come non pianificabile e svuotare i nodi in una delle zone, simulando l'errore, segui questi passaggi:
Verifica la disponibilità del cluster a livello di regione e dei servizi. Guarda i nomi dei nodi della zona di errore target. Devi specificare una zona in cui vengono eseguiti i pod di frontend:
kubectl get pods -o wide
L'output dovrebbe essere simile all'esempio seguente:
NAME READY STATUS RESTARTS AGE IP NODE accounts-db-0 1/1 Running 0 4m7s 10.96.4.4 regional-cluster-1-default-pool-node2 balancereader-7dc7d9ff57-lv4z7 1/1 Running 0 4m7s 10.96.1.5 regional-cluster-1-default-pool-node1 contacts-7ddc76d94-wxvg5 1/1 Running 0 4m7s 10.96.6.11 regional-cluster-1-default-pool-node3 frontend-747b84bff4-gvktl 1/1 Running 0 4m7s 10.96.1.4 regional-cluster-1-default-pool-node1 ledger-db-0 1/1 Running 0 4m7s 10.96.4.5 regional-cluster-1-default-pool-node2 ledger-db-1 1/1 Running 0 3m50s 10.96.0.13 regional-cluster-1-default-pool-node5 ledgerwriter-f6cc7889d-4hqbm 1/1 Running 0 4m6s 10.96.0.12 regional-cluster-1-default-pool-node5 loadgenerator-57d4cb57cc-fmq52 1/1 Running 0 4m6s 10.96.4.6 regional-cluster-1-default-pool-node2 transactionhistory-5dd7c7fd77-72zpx 1/1 Running 0 4m6s 10.96.6.12 regional-cluster-1-default-pool-node3 userservice-cd5ddb4bb-b7862 1/1 Running 0 4m6s 10.96.1.6 regional-cluster-1-default-pool-node1
Associa i pod elencati nell'output precedente alla zona del nodo:
kubectl get node -o=custom-columns='NAME:.metadata.name,ZONE:.metadata.labels.topology\.kubernetes\.io/zone,INT_IP:.status.addresses[0].address'
L'output dovrebbe essere simile all'esempio seguente:
NAME ZONE INT_IP regional-cluster-1-default-pool-node1 asia-southeast1-b 10.148.0.41 regional-cluster-1-default-pool-node2 asia-southeast1-b 10.148.0.42 regional-cluster-1-default-pool-node3 asia-southeast1-a 10.148.0.37 regional-cluster-1-default-pool-node4 asia-southeast1-a 10.148.0.38 regional-cluster-1-default-pool-node5 asia-southeast1-c 10.148.0.40 regional-cluster-1-default-pool-node6 asia-southeast1-c 10.148.0.39
Nell'output di esempio precedente, i pod di frontend si trovano in
regional-cluster-1-default-pool-node1
nella zonaasia-southeast1-b
.Nel passaggio successivo, traccerai tutti i nodi nella zona
asia-southeast1-b
, che in questo esempio sonoregional-cluster-1-default-pool-node1
eregional-cluster-1-default-pool-node2
Contrassegna come non pianificabile e svuota i nodi di destinazione in una delle zone. In questo esempio, sono i due nodi in
asia-southeast1-b
:kubectl drain regional-cluster-1-default-pool-node1 \ --delete-emptydir-data --ignore-daemonsets kubectl drain regional-cluster-1-default-pool-node2 \ --delete-emptydir-data --ignore-daemonsets
Questo comando contrassegna i nodi come non pianificabili e simula gli errori dei nodi. Kubernetes ripianifica i pod in altri nodi nelle zone funzionanti.
Guarda dove vengono ripianificati i nuovi pod di frontend e altri pod di Cymbal Bank di esempio che erano in precedenza in esecuzione sul nodo nella zona di errore:
kubectl get po -o wide kubectl get node -o=custom-columns='NAME:.metadata.name,ZONE:.metadata.labels.topology\.kubernetes\.io/zone,INT_IP:.status.addresses[0].address'
L'output dovrebbe essere simile all'esempio seguente:
NAME READY STATUS RESTARTS AGE IP NODE accounts-db-0 1/1 Running 0 4m7s 10.96.4.4 regional-cluster-1-default-pool-node4 balancereader-7dc7d9ff57-lv4z7 1/1 Running 0 4m7s 10.96.1.5 regional-cluster-1-default-pool-node6 contacts-7ddc76d94-wxvg5 1/1 Running 0 4m7s 10.96.6.11 regional-cluster-1-default-pool-node3 frontend-747b84bff4-gvktl 1/1 Running 0 4m7s 10.96.1.4 regional-cluster-1-default-pool-node3 ledger-db-0 1/1 Running 0 4m7s 10.96.4.5 regional-cluster-1-default-pool-node6 ledger-db-1 1/1 Running 0 3m50s 10.96.0.13 regional-cluster-1-default-pool-node5 ledgerwriter-f6cc7889d-4hqbm 1/1 Running 0 4m6s 10.96.0.12 regional-cluster-1-default-pool-node5 loadgenerator-57d4cb57cc-fmq52 1/1 Running 0 4m6s 10.96.4.6 regional-cluster-1-default-pool-node4 transactionhistory-5dd7c7fd77-72zpx 1/1 Running 0 4m6s 10.96.6.12 regional-cluster-1-default-pool-node3 userservice-cd5ddb4bb-b7862 1/1 Running 0 4m6s 10.96.1.6 regional-cluster-1-default-pool-node3 NAME ZONE INT_IP regional-cluster-1-default-pool-node3 asia-southeast1-a 10.148.0.37 regional-cluster-1-default-pool-node4 asia-southeast1-a 10.148.0.38 regional-cluster-1-default-pool-node5 asia-southeast1-c 10.148.0.40 regional-cluster-1-default-pool-node6 asia-southeast1-c 10.148.0.39
In questo output di esempio, non esistono pod Cymbal Bank di esempio in esecuzione su nodi non pianificabili e tutti i pod vengono ora eseguiti solo nelle altre due zone.
I budget di interruzione dei pod (PDB) sui nodi potrebbero bloccare lo svuotamento dei nodi. Valuta i criteri PDB prima dell'azione di cordon e drenaggio. Per saperne di più sul PDB e sulla sua relazione con la gestione delle interruzioni, scopri come garantire affidabilità e uptime per il tuo cluster GKE.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial:
Elimina il progetto
Il modo più semplice per eliminare la fatturazione è eliminare il progetto creato per il tutorial.
- Nella console Google Cloud, vai alla pagina Gestisci risorse.
- Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
Passaggi successivi
- Scopri come simulare un'interruzione di zona per un gruppo di istanze gestite a livello di regione.
- Scopri di più sul ripristino di emergenza su Google Cloud.
- Configura l'alta disponibilità di PostgreSQL in più zone.
- Considerazioni sul budget per l'interruzione dei pod.
- Scopri di più sui dischi permanenti a livello di zona e di regione.
- Scopri come eseguire database ad alta disponibilità in GKE.
- Scopri di più sulle best practice per il ripristino di emergenza su Google Cloud.
- Scopri di più su Backup per GKE.