Questo tutorial mostra come eseguire un'applicazione web basata su un database relazionale ad alta disponibilità su larga scala in Google Kubernetes Engine (GKE).
L'applicazione di esempio utilizzata in questo tutorial è Bank of Anthos, un servizio un'applicazione web che simula una rete di elaborazione dei pagamenti di una banca. Bank of Anthos utilizza più servizi per funzionare. Questo tutorial si concentra sul frontend del sito web e sui database PostgreSQL relazionali che supportano i servizi di Bank of Anthos. Per saperne di più su Bank of Anthos, tra cui l'architettura e i servizi di cui esegue il deployment, Bank of Anthos su GitHub.
Obiettivi
- Crea e configura un cluster GKE.
- Esegui il deployment di un'applicazione web di esempio e di un database PostgreSQL ad alta disponibilità.
- Configura la scalabilità automatica dell'applicazione web e del database.
- Simula i picchi di traffico utilizzando un generatore di carico.
- Osserva come i servizi aumentano e diminuiscono di dimensioni.
Costi
In questo documento utilizzi i seguenti componenti fatturabili di Google Cloud:
Per generare una stima dei costi basata sull'utilizzo previsto,
utilizza il Calcolatore prezzi.
Una volta completate le attività descritte in questo documento, puoi evitare la fatturazione continua eliminando le risorse che hai creato. Per ulteriori informazioni, consulta la pagina Pulizia.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the GKE API:
gcloud services enable container.googleapis.com
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the GKE API:
gcloud services enable container.googleapis.com
- Installa l'interfaccia a riga di comando Helm.
Prepara l'ambiente
Clona il repository di esempio utilizzato in questo tutorial:
git clone https://github.com/GoogleCloudPlatform/bank-of-anthos.git cd bank-of-anthos/
Imposta le variabili di ambiente:
PROJECT_ID=PROJECT_ID GSA_NAME=bank-of-anthos GSA_EMAIL=bank-of-anthos@${PROJECT_ID}.iam.gserviceaccount.com KSA_NAME=default
Sostituisci
PROJECT_ID
con l'ID del tuo progetto Google Cloud.
configura gli account cluster e di servizio
Crea un cluster:
gcloud container clusters create-auto bank-of-anthos --region=us-central1
L'avvio del cluster potrebbe richiedere fino a cinque minuti.
Crea un account di servizio IAM:
gcloud iam service-accounts create bank-of-anthos
Concedi l'accesso all'account di servizio IAM:
gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/cloudtrace.agent \ --member "serviceAccount:bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com" gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/monitoring.metricWriter \ --member "serviceAccount:bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com" gcloud iam service-accounts add-iam-policy-binding "bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com" \ --role roles/iam.workloadIdentityUser \ --member "serviceAccount:PROJECT_ID.svc.id.goog[default/default]"
Questo passaggio concede il seguente accesso:
roles/cloudtrace.agent
: scrivi i dati di traccia, ad esempio le informazioni sulla latenza, in Trace.roles/monitoring.metricWriter
: scrivi metriche in Cloud Monitoring.roles/iam.workloadIdentityUser
: consenti a un account di servizio Kubernetes di utilizzare la federazione delle identità per i carichi di lavoro per GKE per agire come account di servizio IAM.
Configura l'account di servizio Kubernetes
default
nello spazio dei nomidefault
in modo che agisca come l'account di servizio IAM che hai creato:kubectl annotate serviceaccount default \ iam.gke.io/gcp-service-account=bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com
In questo modo, i pod che utilizzano l'account di servizio Kubernetes
default
nello spazio dei nomidefault
possono accedere alle stesse risorse Google Cloud dell'account di servizio IAM.
Esegui il deployment di Bank of Anthos e PostgreSQL
In questa sezione, installi Bank of Anthos e un database PostgreSQL in modalità di alta disponibilità (HA), che ti consente di eseguire il ridimensionamento automatico delle repliche del server database. Se vuoi visualizzare gli script, il grafico Helm e i manifest di Kubernetes utilizzati in questa sezione, consulta il repository Bank of Anthos su GitHub.
Esegui il deployment dello schema del database e di uno script DDL (Data Definition Language):
kubectl create configmap initdb \ --from-file=src/accounts/accounts-db/initdb/0-accounts-schema.sql \ --from-file=src/accounts/accounts-db/initdb/1-load-testdata.sql \ --from-file=src/ledger/ledger-db/initdb/0_init_tables.sql \ --from-file=src/ledger/ledger-db/initdb/1_create_transactions.sh
Installa PostgreSQL utilizzando il grafico Helm di esempio:
helm repo add bitnami https://charts.bitnami.com/bitnami helm install accounts-db bitnami/postgresql-ha \ --version 10.0.1 \ --values extras/postgres-hpa/helm-postgres-ha/values.yaml \ --set="postgresql.initdbScriptsCM=initdb" \ --set="postgresql.replicaCount=1" \ --wait
Questo comando crea un cluster PostgreSQL con un conteggio delle repliche iniziale pari a 1. Più avanti in questo tutorial, scalarai il cluster in base alle connessioni in entrata. Questa operazione potrebbe richiedere dieci minuti o più.
Esegui il deployment di Bank of Anthos:
kubectl apply -f extras/jwt/jwt-secret.yaml kubectl apply -f extras/postgres-hpa/kubernetes-manifests
Il completamento dell'operazione potrebbe richiedere alcuni minuti.
Checkpoint: convalida la configurazione
Verifica che tutti i pod di Bank of Anthos siano in esecuzione:
kubectl get pods
L'output è simile al seguente:
NAME READY STATUS accounts-db-pgpool-57ffc9d685-c7xs8 3/3 Running accounts-db-postgresql-0 1/1 Running balancereader-57b59769f8-xvp5k 1/1 Running contacts-54f59bb669-mgsqc 1/1 Running frontend-6f7fdc5b65-h48rs 1/1 Running ledgerwriter-cd74db4cd-jdqql 1/1 Running pgpool-operator-5f678457cd-cwbhs 1/1 Running transactionhistory-5b9b56b5c6-sz9qz 1/1 Running userservice-f45b46b49-fj7vm 1/1 Running
Verifica di poter accedere al frontend del sito web:
Ottieni l'indirizzo IP esterno del servizio
frontend
:kubectl get ingress frontend
L'output è simile al seguente:
NAME CLASS HOSTS ADDRESS PORTS AGE frontend <none> * 203.0.113.9 80 12m
In un browser, vai all'indirizzo IP esterno. Viene visualizzata la pagina di accesso di Bank of Anthos. Se vuoi saperne di più, dai un'occhiata all'applicazione.
Se viene visualizzato l'errore 404, attendi qualche minuto che i microservizi eseguire il provisioning e riprovare.
Scala automaticamente l'app web e il database PostgreSQL
GKE Autopilot esegue la scalabilità automatica delle risorse di calcolo del cluster in base al numero di carichi di lavoro nel cluster. Per scalare automaticamente di pod nel cluster in base alle metriche delle risorse, devi implementare Kubernetes scalabilità automatica orizzontale dei pod. Puoi utilizzare le metriche integrate di CPU e memoria Kubernetes oppure come le richieste HTTP al secondo o la quantità di istruzioni SELECT, da Cloud Monitoring.
In questa sezione imparerai a:
- Configura la scalabilità automatica del pod orizzontale per i microservizi Bank of Anthos utilizzando sia le metriche integrate sia quelle personalizzate.
- Simula il carico nell'applicazione Bank of Anthos per attivare gli eventi di scalabilità automatica.
- Osserva come il numero di pod e dei nodi nel cluster viene scalato automaticamente in base al carico.
Configura la raccolta di metriche personalizzate
Per leggere le metriche personalizzate da Monitoring, devi eseguire il deployment Metriche personalizzate - Adattatore Stackdriver nel tuo cluster.
Distribuisci l'adattatore:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter.yaml
Configura l'adattatore in modo che utilizzi la federazione delle identità per i carichi di lavoro per GKE al fine di ottenere le metriche:
Configura l'account di servizio IAM:
gcloud projects add-iam-policy-binding PROJECT_ID \ --member "serviceAccount:bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com" \ --role roles/monitoring.viewer gcloud iam service-accounts add-iam-policy-binding bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com \ --role roles/iam.workloadIdentityUser \ --member "serviceAccount:PROJECT_ID.svc.id.goog[custom-metrics/custom-metrics-stackdriver-adapter]"
Aggiungi un'annotazione all'account di servizio Kubernetes utilizzato dall'adattatore:
kubectl annotate serviceaccount custom-metrics-stackdriver-adapter \ --namespace=custom-metrics \ iam.gke.io/gcp-service-account=bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com
Riavvia il deployment dell'adattatore per propagare le modifiche:
kubectl rollout restart deployment custom-metrics-stackdriver-adapter \ --namespace=custom-metrics
Configura la scalabilità automatica per il database
Quando hai implementato Bank of Anthos e PostgreSQL in precedenza in questo tutorial, hai implementato il database come StatefulSet con una replica di lettura/scrittura principale per gestire tutti gli statement SQL in entrata. In questa sezione,
configurare la scalabilità automatica orizzontale dei pod per aggiungere nuove repliche di sola lettura in standby
gestire le istruzioni SELECT in arrivo. Un buon modo per ridurre il carico su ogni
replica è distribuire le istruzioni SELECT, che sono operazioni di lettura. Il deployment di PostgreSQL include uno strumento denominato Pgpool-II
che realizza questo bilanciamento del carico e migliora il throughput del sistema.
PostgreSQL esporta la metrica dell'istruzione SELECT come
metrica Prometheus.
Utilizzerai un esportatore di metriche leggero denominato prometheus-to-sd
per inviare queste metriche
le metriche a Cloud Monitoring in un formato supportato.
Esamina l'oggetto
HorizontalPodAutoscaler
:Questo manifest esegue le seguenti operazioni:
- Imposta il numero massimo di repliche durante un ridimensionamento su
5
. - Imposta il numero minimo di durante uno scale down a
1
. - Utilizza una metrica esterna per prendere decisioni di scalabilità. In questo esempio, è il numero di istruzioni SELECT. Si verifica un evento di scale up se il conteggio delle istruzioni SELECT in arrivo supera 15.
- Imposta il numero massimo di repliche durante un ridimensionamento su
Applica il manifest al cluster:
kubectl apply -f extras/postgres-hpa/hpa/postgresql-hpa.yaml
Configura la scalabilità automatica per l'interfaccia web
In Deployment di Bank of Anthos e PostgreSQL hai eseguito il deployment
l'interfaccia web di Bank of Anthos. Quando il numero di utenti aumenta,
Il servizio userservice
consuma più risorse della CPU. In questa sezione, configurerai la scalabilità automatica dei pod orizzontali per il deployment userservice
quando i pod esistenti utilizzano più del 60% della CPU richiesta e per il deployment frontend
quando il numero di richieste HTTP in arrivo al bilanciatore del carico è superiore a 5 al secondo.
Configura la scalabilità automatica per il deployment di userservice
Esamina il manifest
HorizontalPodAutoscaler
per l'elementouserservice
Deployment:Questo manifest esegue le seguenti operazioni:
- Imposta il numero massimo di repliche durante un ridimensionamento su
50
. - Imposta il numero minimo di durante uno scale down a
5
. - Utilizza una metrica Kubernetes integrata per prendere decisioni di scalabilità. In questo esempio, la metrica è l'utilizzo della CPU e l'utilizzo target è il 60%, evitando così sia il sovrache che il sottoutilizzo.
- Imposta il numero massimo di repliche durante un ridimensionamento su
Applica il manifest al cluster:
kubectl apply -f extras/postgres-hpa/hpa/userservice.yaml
configura la scalabilità automatica per il deployment frontend
Esamina il manifest
HorizontalPodAutoscaler
per il deploymentuserservice
:Questo manifest utilizza i seguenti campi:
spec.scaleTargetRef
: la risorsa Kubernetes da scalare.spec.minReplicas
: il numero minimo di repliche, pari a5
in questo valore campione.spec.maxReplicas
: il numero massimo di repliche, che è25
in in questo esempio.spec.metrics.*
: la metrica da utilizzare. In questo esempio, si tratta del numero di richieste HTTP al secondo, una metrica personalizzata di Cloud Monitoring fornita dall'adattatore di cui è stato eseguito il deployment.spec.metrics.external.metric.selector.matchLabels
: l'etichetta della risorsa specifica da filtrare durante la scalabilità automatica.
Trova il nome della regola di inoltro dal bilanciatore del carico al deployment
frontend
:export FW_RULE=$(kubectl get ingress frontend -o=jsonpath='{.metadata.annotations.ingress\.kubernetes\.io/forwarding-rule}') echo $FW_RULE
L'output è simile al seguente:
k8s2-fr-j76hrtv4-default-frontend-wvvf7381
Aggiungi la regola di inoltro al manifest:
sed -i "s/FORWARDING_RULE_NAME/$FW_RULE/g" "extras/postgres-hpa/hpa/frontend.yaml"
Questo comando sostituisce
FORWARDING_RULE_NAME
con la regola di forwarding salvata.Applica il manifest al cluster:
kubectl apply -f extras/postgres-hpa/hpa/frontend.yaml
Checkpoint: convalida la configurazione della scalabilità automatica
Visualizza lo stato delle risorse HorizontalPodAutoscaler
:
kubectl get hpa
L'output è simile al seguente:
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
accounts-db-postgresql StatefulSet/accounts-db-postgresql 10905m/15 (avg) 1 5 2 5m2s
contacts Deployment/contacts 1%/70% 1 5 1 11m
frontend Deployment/frontend <unknown>/5 (avg) 5 25 1 34s
userservice Deployment/userservice 0%/60% 5 50 5 4m56s
A questo punto, hai configurato la tua applicazione e configurato la scalabilità automatica. Il tuo il frontend e il database possono ora scalare in base alle metriche fornito.
Simula il carico e osserva la scalabilità di GKE
Bank of Anthos include un servizio loadgenerator
che consente di simulare il traffico
per testare la scalabilità della tua applicazione sotto carico. In questa sezione, eseguirai il deployment
loadgenerator
genera un carico e osserva la conseguente scalabilità.
Esegui il deployment del generatore di test di carico
Crea una variabile di ambiente con l'indirizzo IP del bilanciatore del carico di Bank of Anthos:
export LB_IP=$(kubectl get ingress frontend -o=jsonpath='{.status.loadBalancer.ingress[0].ip}') echo $LB_IP
L'output è simile al seguente:
203.0.113.9
Aggiungi l'indirizzo IP del bilanciatore del carico al manifest:
sed -i "s/FRONTEND_IP_ADDRESS/$LB_IP/g" "extras/postgres-hpa/loadgenerator.yaml"
Applica il manifest al cluster:
kubectl apply -f extras/postgres-hpa/loadgenerator.yaml
Il generatore di carico inizia ad aggiungere un utente ogni secondo, fino a un massimo di 250 utenti.
Simula il carico
In questa sezione viene utilizzato un generatore di carico per simulare picchi di traffico e osserva lo scale up del numero di repliche e del numero di nodi per adeguarsi all'aumento nel tempo. Termina il test e osserva il ridimensionamento delle repliche e del numero di nodi in risposta.
Esponi localmente l'interfaccia web del generatore di carico:
kubectl port-forward svc/loadgenerator 8080
Se viene visualizzato un messaggio di errore, riprova quando il pod è in esecuzione.
Apri l'interfaccia web del generatore di carico in un browser.
- Se utilizzi una shell locale, apri un browser e vai all'indirizzo http://127.0.0.1:8080.
- Se utilizzi Cloud Shell, fai clic su Anteprima web e poi su Anteprima sulla porta 8080.
Fai clic sulla scheda Grafici per osservare il rendimento nel tempo.
Apri una nuova finestra del terminale e controlla il numero di repliche degli adeguatori automatici dei pod orizzontali:
kubectl get hpa -w
Il numero di repliche aumenta con l'aumento del carico. L'aumento di scala potrebbe richiedere circa dieci minuti.
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS accounts-db-postgresql StatefulSet/accounts-db-postgresql 8326m/15 (avg) 1 5 5 contacts Deployment/contacts 51%/70% 1 5 2 frontend Deployment/frontend 5200m/5 (avg) 5 25 13 userservice Deployment/userservice 71%/60% 5 50 17
Apri un'altra finestra del terminale e controlla il numero di nodi nel cluster:
gcloud container clusters list \ --filter='name=bank-of-anthos' \ --format='table(name, currentMasterVersion, currentNodeVersion, currentNodeCount)' \ --region="us-central1"
Il numero di nodi è aumentato dalla quantità iniziale di tre nodi che ospita le nuove repliche.
Apri l'interfaccia del generatore di carico e fai clic su Arresta per terminare il test.
Controlla di nuovo il numero di repliche e il numero di nodi e osserva i numeri si riducono con il carico ridotto. Lo scale down potrebbe richiedere del tempo, perché la finestra di stabilizzazione predefinita per le repliche nella risorsa Kubernetes
HorizontalPodAutoscaler
è di cinque minuti. Per ulteriori informazioni, Consulta la Finestra di stabilizzazione.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Elimina singole risorse
Google Cloud crea risorse, come i bilanciatori del carico, in base agli oggetti Kubernetes che crei. Per eliminare tutte le risorse in questo segui questi passaggi:
Elimina le risorse Kubernetes di esempio:
kubectl delete \ -f extras/postgres-hpa/loadgenerator.yaml \ -f extras/postgres-hpa/hpa \ -f extras/postgres-hpa/kubernetes-manifests \ -f extras/jwt/jwt-secret.yaml \ -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter.yaml
Elimina il database PostgreSQL:
helm uninstall accounts-db kubectl delete pvc -l "app.kubernetes.io/instance=accounts-db" kubectl delete configmaps initdb
Elimina il cluster GKE e l'account di servizio IAM:
gcloud iam service-accounts delete "bank-of-anthos@PROJECT_ID.iam.gserviceaccount.com" --quiet gcloud container clusters delete "bank-of-anthos" --region="us-central1" --quiet
Elimina il progetto
Delete a Google Cloud project:
gcloud projects delete PROJECT_ID
Passaggi successivi
- Informazioni su scalabilità automatica pod verticale, che puoi utilizzare per regolare automaticamente le richieste di risorse per i pod carichi di lavoro con suggerimenti basati sull'utilizzo storico.
- Scopri di più su scalabilità automatica orizzontale dei pod.