In questo tutorial puoi configurare la scalabilità automatica in base a uno dei seguenti metrics:
CPU
Utilizzo CPU
Scalabilità in base alla percentuale di utilizzo delle CPU tra i nodi. Può essere economicamente convenienti, consentendoti di massimizzare l'utilizzo delle risorse della CPU. Poiché L'utilizzo della CPU è una metrica finale, ma i tuoi utenti potrebbero riscontrare latenza mentre è in corso uno scale up.
Pub/Sub
Backlog Pub/Sub
Applicare la scalabilità in base a una metrica esterna che segnala il numero di non riconosciuti messaggi rimanenti in Sottoscrizione Pub/Sub. In questo modo, è possibile ridurre la latenza prima che diventi un problema, ma potresti utilizzare una quantità rispetto alla scalabilità automatica basata sull'utilizzo della CPU.
Metrica personalizzata
Metrica Prometheus personalizzata
Applica la scalabilità in base a una metrica personalizzata definita dall'utente, esportata in Prometheus tramite Google Managed Prometheus. Il tuo La metrica di Prometheus deve essere di tipo Indicatore.
La scalabilità automatica punta fondamentalmente a trovare un equilibrio accettabile tra costi e latenza. Ti consigliamo di sperimentare una combinazione di queste metriche e altri per trovare una norma adatta alle tue esigenze.
Obiettivi
Questo tutorial copre le seguenti attività:- Come eseguire il deployment dell'adattatore delle metriche personalizzate.
- Come esportare le metriche dal codice dell'applicazione.
- Come visualizzare le metriche nell'interfaccia di Cloud Monitoring.
- Eseguire il deployment di un HorizontalPodAutoscaler (HPA) per scalare l'applicazione in base alle metriche di Cloud Monitoring.
Costi
In questo documento vengono utilizzati i seguenti componenti fatturabili di Google Cloud:
Per generare una stima dei costi basata sull'utilizzo previsto,
utilizza il Calcolatore prezzi.
Una volta completate le attività descritte in questo documento, puoi evitare la fatturazione continua eliminando le risorse che hai creato. Per ulteriori informazioni, consulta la pagina Pulizia.
Prima di iniziare
Per abilitare l'API Kubernetes Engine, segui questi passaggi:- Visita il pagina Kubernetes Engine nella console Google Cloud.
- Crea o seleziona un progetto.
- Attendi che l'API e i servizi correlati siano abilitati. Questa operazione può richiedere diversi minuti.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
Puoi seguire questo tutorial utilizzando Cloud Shell, disponibile
sono preinstallati gli strumenti a riga di comando gcloud
e kubectl
utilizzati
in questo tutorial. Se utilizzi Cloud Shell, non è necessario installare
a riga di comando sulla workstation.
Per utilizzare Cloud Shell:
- Vai alla console Google Cloud.
Fai clic su Attiva Cloud Shell nella parte superiore della finestra della console Google Cloud.
Una sessione di Cloud Shell si apre all'interno di un nuovo frame in basso della console Google Cloud e visualizza un prompt della riga di comando.
Configurazione dell'ambiente
Imposta la zona predefinita per Google Cloud CLI:
gcloud config set compute/zone zone
Sostituisci quanto segue:
zone
: scegli la zona più vicina a te. Per ulteriori informazioni, vedi Regioni e zone.
Imposta le variabili di ambiente
PROJECT_ID
ePROJECT_NUMBER
sul tuo ID e numero di progetto Google Cloud:export PROJECT_ID=project-id export PROJECT_NUMBER=$(gcloud projects describe $PROJECT_ID --format 'get(projectNumber)')
Imposta la zona predefinita per Google Cloud CLI:
gcloud config set project $PROJECT_ID
Crea un cluster GKE cluster
Per maggiore sicurezza durante l'accesso ai servizi Google Cloud, ti consigliamo abilitando la Federazione delle identità per i carichi di lavoro per GKE sul tuo cluster. Mentre questa pagina include esempi che utilizzano il metodo precedente (con Federazione delle identità per i carichi di lavoro per GKE disabilitata), la sua abilitazione migliora la protezione.
Workload Identity
Per creare un cluster con la federazione delle identità per i carichi di lavoro abilitata per GKE, esegui questo comando :
gcloud container clusters create metrics-autoscaling --workload-pool=$PROJECT_ID.svc.id.goog
Autenticazione legacy
Per creare un cluster con federazione delle identità per i carichi di lavoro per GKE disabilitata, esegui seguente comando:
gcloud container clusters create metrics-autoscaling
Deployment dell'adattatore delle metriche personalizzate
L'adattatore delle metriche personalizzate consente al cluster di inviare e ricevere le metriche con Cloud Monitoring.
CPU
Non applicabile: Horizontal Pod Autoscaler possono scalare in base all'utilizzo della CPU in modo nativo, per cui non occorre l'adattatore delle metriche personalizzate.
Pub/Sub
La procedura per installare l'adattatore delle metriche personalizzate è diversa per i cluster con o senza la federazione delle identità per i carichi di lavoro per GKE. Seleziona l'opzione corrispondente alla configurazione che hai scelto quando hai creato il cluster.
Workload Identity
Concedi all'utente la possibilità di creare i ruoli di autorizzazione richiesti:
kubectl create clusterrolebinding cluster-admin-binding \
--clusterrole cluster-admin --user "$(gcloud config get-value account)"
Esegui il deployment dell'adattatore delle metriche personalizzate sul tuo cluster:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter_new_resource_model.yaml
L'adattatore utilizza il piano custom-metrics-stackdriver-adapter
di Kubernetes
nello spazio dei nomi custom-metrics
. Consenti questo servizio
di Cloud Monitoring per leggere le metriche di Cloud Monitoring assegnandole
Ruolo Visualizzatore Monitoring:
gcloud projects add-iam-policy-binding projects/$PROJECT_ID \
--role roles/monitoring.viewer \
--member=principal://iam.googleapis.com/projects/$PROJECT_NUMBER/locations/global/workloadIdentityPools/$PROJECT_ID.svc.id.goog/subject/ns/custom-metrics/sa/custom-metrics-stackdriver-adapter
Autenticazione legacy
Concedi all'utente la possibilità di creare i ruoli di autorizzazione richiesti:
kubectl create clusterrolebinding cluster-admin-binding \
--clusterrole cluster-admin --user "$(gcloud config get-value account)"
Esegui il deployment dell'adattatore delle metriche personalizzate sul tuo cluster:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter_new_resource_model.yaml
Metrica personalizzata
La procedura per installare l'adattatore delle metriche personalizzate è diversa per i cluster con o senza la federazione delle identità per i carichi di lavoro per GKE. Seleziona l'opzione corrispondente alla configurazione che hai scelto quando hai creato il cluster.
Workload Identity
Concedi all'utente la possibilità di creare i ruoli di autorizzazione richiesti:
kubectl create clusterrolebinding cluster-admin-binding \
--clusterrole cluster-admin --user "$(gcloud config get-value account)"
Esegui il deployment dell'adattatore delle metriche personalizzate sul tuo cluster:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter_new_resource_model.yaml
L'adattatore utilizza il piano custom-metrics-stackdriver-adapter
di Kubernetes
nello spazio dei nomi custom-metrics
. Consenti questo servizio
di Cloud Monitoring per leggere le metriche di Cloud Monitoring assegnandole
Ruolo Visualizzatore Monitoring:
gcloud projects add-iam-policy-binding projects/$PROJECT_ID \
--role roles/monitoring.viewer \
--member=principal://iam.googleapis.com/projects/$PROJECT_NUMBER/locations/global/workloadIdentityPools/$PROJECT_ID.svc.id.goog/subject/ns/custom-metrics/sa/custom-metrics-stackdriver-adapter
Autenticazione legacy
Concedi all'utente la possibilità di creare i ruoli di autorizzazione richiesti:
kubectl create clusterrolebinding cluster-admin-binding \
--clusterrole cluster-admin --user "$(gcloud config get-value account)"
Esegui il deployment dell'adattatore delle metriche personalizzate sul tuo cluster:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter_new_resource_model.yaml
Deployment di un'applicazione con metriche
Scarica il repository contenente il codice dell'applicazione per questo tutorial:
CPU
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/quickstarts/hello-app
Pub/Sub
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/databases/cloud-pubsub
Metrica personalizzata
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/observability/custom-metrics-autoscaling/google-managed-prometheus
Il repository contiene codice che esporta le metriche in Cloud Monitoring:
CPU
Questa applicazione risponde "Hello, world!" a tutte le richieste web sulla porta
8080
. Le metriche di CPU di Compute Engine vengono automaticamente
raccolte da Cloud Monitoring.
Pub/Sub
Questa applicazione esegue il polling di una sottoscrizione Pub/Sub per i nuovi messaggi, ricevendoli all'arrivo. Pub/Sub le metriche dell'abbonamento vengono raccolte automaticamente da Cloud Monitoring.
Metrica personalizzata
Questa applicazione risponde a qualsiasi richiesta web al percorso /metrics
con un
metrica a valore costante utilizzando il formato Prometheus.
Il repository contiene anche un manifest Kubernetes su cui eseguire il deployment dell'applicazione. nel tuo cluster:
CPU
Pub/Sub
Il manifest è diverso per i cluster con o senza federazione delle identità per i carichi di lavoro per GKE in un bucket con il controllo delle versioni attivo. Seleziona l'opzione corrispondente alla configurazione scelta quando creato il tuo cluster.
Workload Identity
Autenticazione legacy
Metrica personalizzata
Con la risorsa PodMonitoring, Google Cloud Managed Service per Prometheus esporta Metriche Prometheus a Cloud Monitoring:
Esegui il deployment dell'applicazione nel tuo cluster:
CPU
kubectl apply -f manifests/helloweb-deployment.yaml
Pub/Sub
La procedura per il deployment dell'applicazione è diversa per i cluster con o senza che sia abilitata la federazione delle identità per i carichi di lavoro per GKE. Seleziona l'opzione corrispondente alla configurazione che hai scelto quando hai creato il cluster.
Workload Identity
Abilita l'API Pub/Sub sul tuo progetto:
gcloud services enable cloudresourcemanager.googleapis.com pubsub.googleapis.com
Crea un argomento e una sottoscrizione Pub/Sub:
gcloud pubsub topics create echo gcloud pubsub subscriptions create echo-read --topic=echo
Esegui il deployment dell'applicazione nel tuo cluster:
kubectl apply -f deployment/pubsub-with-workload-identity.yaml
Questa applicazione definisce un account di servizio Kubernetes
pubsub-sa
. Assegna il ruolo Sottoscrittore Pub/Sub per consentire all'applicazione di pubblicare messaggi l'argomento Pub/Sub.gcloud projects add-iam-policy-binding projects/jmfran-gke-dev \ --role=roles/pubsub.subscriber \ --member=principal://iam.googleapis.com/projects/$PROJECT_NUMBER/locations/global/workloadIdentityPools/$PROJECT_ID.svc.id.goog/subject/ns/default/sa/pubsub-sa
Autenticazione legacy
Abilita l'API Pub/Sub sul tuo progetto:
gcloud services enable cloudresourcemanager.googleapis.com pubsub.googleapis.com
Crea un argomento e una sottoscrizione Pub/Sub:
gcloud pubsub topics create echo gcloud pubsub subscriptions create echo-read --topic=echo
Crea un account di servizio con accesso a Pub/Sub:
gcloud iam service-accounts create autoscaling-pubsub-sa gcloud projects add-iam-policy-binding $PROJECT_ID \ --member "serviceAccount:autoscaling-pubsub-sa@$PROJECT_ID.iam.gserviceaccount.com" \ --role "roles/pubsub.subscriber"
Scarica il file della chiave dell'account di servizio:
gcloud iam service-accounts keys create key.json \ --iam-account autoscaling-pubsub-sa@$PROJECT_ID.iam.gserviceaccount.com
Importa la chiave dell'account di servizio nel cluster come Secret:
kubectl create secret generic pubsub-key --from-file=key.json=./key.json
Esegui il deployment dell'applicazione nel tuo cluster:
kubectl apply -f deployment/pubsub-with-secret.yaml
Metrica personalizzata
kubectl apply -f custom-metrics-gmp.yaml
Dopo aver atteso il deployment dell'applicazione, tutti i pod raggiungono Ready
stato:
CPU
kubectl get pods
Output:
NAME READY STATUS RESTARTS AGE
helloweb-7f7f7474fc-hzcdq 1/1 Running 0 10s
Pub/Sub
kubectl get pods
Output:
NAME READY STATUS RESTARTS AGE
pubsub-8cd995d7c-bdhqz 1/1 Running 0 58s
Metrica personalizzata
kubectl get pods
Output:
NAME READY STATUS RESTARTS AGE
custom-metrics-gmp-865dffdff9-x2cg9 1/1 Running 0 49s
Visualizzazione delle metriche su Cloud Monitoring
Durante l'esecuzione, l'applicazione scrive le metriche in Cloud Monitoring.
Per visualizzare le metriche per una risorsa monitorata mediante Metrics Explorer, segui questi passaggi:
-
Nella console Google Cloud, vai alla leaderboard Pagina Esplora metriche:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoraggio.
- Nell'elemento Metrica, espandi il menu Seleziona una metrica e poi
seleziona un tipo di risorsa e un tipo di metrica. Ad esempio, per tracciare un grafico sull'utilizzo della CPU
macchina virtuale, segui questi passaggi:
- (Facoltativo) Per ridurre le opzioni del menu, inserisci parte del nome della metrica nel
Barra dei filtri. Per questo esempio, inserisci
utilization
. - Nel menu Risorse attive, seleziona Istanza VM.
- Nel menu Categorie di metriche attive, seleziona Istanza.
- Nel menu Metriche attive, seleziona Utilizzo CPU e poi fai clic su Applica.
- (Facoltativo) Per ridurre le opzioni del menu, inserisci parte del nome della metrica nel
Barra dei filtri. Per questo esempio, inserisci
Per filtrare le serie temporali visualizzate, utilizza la Elemento Filtro:
Per combinare le serie temporali, utilizza i menu nella Elemento di aggregazione: Ad esempio, per visualizzare l'utilizzo della CPU per le VM, in base alla zona, imposta il valore il primo menu su Media e il secondo menu su zone.
Tutte le serie temporali vengono visualizzate nel primo menu dell'elemento Aggregation è impostato su Unaggregated (Non aggregato). Le impostazioni predefinite per l'elemento Aggregation sono determinati dal tipo di metrica selezionato.
Il tipo di risorsa e le metriche sono i seguenti:
CPU
Tipo di risorsa: gce_instance
Metrica: compute.googleapis.com/instance/cpu/utilization
Pub/Sub
Tipo di risorsa: pubsub_subscription
Metrica: pubsub.googleapis.com/subscription/num_undelivered_messages
Metrica personalizzata
Tipo di risorsa: prometheus_target
Metrica: prometheus.googleapis.com/custom_prometheus/gauge
Creazione di un oggetto HorizontalPodAutoscaler
Quando vedi la metrica in Cloud Monitoring, puoi eseguire il deployment
HorizontalPodAutoscaler
per ridimensionare il deployment in base alla metrica.
CPU
Pub/Sub
Metrica personalizzata
Esegui il deployment di HorizontalPodAutoscaler
nel tuo cluster:
CPU
kubectl apply -f manifests/helloweb-hpa.yaml
Pub/Sub
kubectl apply -f deployment/pubsub-hpa.yaml
Metrica personalizzata
kubectl apply -f custom-metrics-gmp-hpa.yaml
Generazione del carico in corso...
Per alcune metriche, potrebbe essere necessario generare un carico per osservare la scalabilità automatica:
CPU
Simula 10.000 richieste al server helloweb
:
kubectl exec -it deployments/helloweb -- /bin/sh -c \
"for i in $(seq -s' ' 1 10000); do wget -q -O- localhost:8080; done"
Pub/Sub
Pubblica 200 messaggi nell'argomento Pub/Sub:
for i in {1..200}; do gcloud pubsub topics publish echo --message="Autoscaling #${i}"; done
Metrica personalizzata
Non applicabile: il codice utilizzato in questo esempio esporta un valore costante 40
per la metrica personalizzata. HorizontalPodAutoscaler è impostato con un valore
valore target di 20
, quindi tenta di fare lo scale up del deployment
automaticamente.
Osservazione dello scale up di HorizontalPodAutoscaler
Puoi controllare il numero attuale di repliche del tuo deployment eseguendo:
kubectl get deployments
Dopo aver concesso un po' di tempo per la propagazione della metrica, Deployment crea cinque pod per gestire il backlog.
Puoi anche esaminare lo stato e l'attività recente del HorizontalPodAutoscaler eseguendo:
kubectl describe hpa
Esegui la pulizia
Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
CPU
Elimina il tuo cluster GKE:
gcloud container clusters delete metrics-autoscaling
Pub/Sub
Esegui la pulizia della sottoscrizione Pub/Sub e dell'argomento:
gcloud pubsub subscriptions delete echo-read gcloud pubsub topics delete echo
Elimina il tuo cluster GKE:
gcloud container clusters delete metrics-autoscaling
Metrica personalizzata
Elimina il tuo cluster GKE:
gcloud container clusters delete metrics-autoscaling
Passaggi successivi
Scopri di più sulle metriche personalizzate ed esterne per la scalabilità dei carichi di lavoro.
Esplora altri tutorial su Kubernetes Engine.