In questo tutorial puoi configurare la scalabilità automatica in base a una delle quattro metriche diverse:
CPU
Utilizzo CPU
Scala in base all'utilizzo percentuale delle CPU nei nodi. Ciò può essere conveniente, consentendoti di massimizzare l'utilizzo delle risorse della CPU. Poiché l'utilizzo della CPU è una metrica finale, tuttavia, gli utenti potrebbero riscontrare una latenza mentre è in corso uno scale up.
Pub/Sub
Backlog Pub/Sub
Scala in base al numero di messaggi non confermati rimanenti in una sottoscrizione Pub/Sub. Questo può ridurre in modo efficace la latenza prima che diventi un problema, ma potrebbe utilizzare risorse relativamente più elevate rispetto alla scalabilità automatica basata sull'utilizzo della CPU.
Metrica personalizzata
Metrica di Cloud Monitoring personalizzata
Scala in base a una metrica personalizzata definita dall'utente esportata dalle librerie client di Cloud Monitoring. Per saperne di più, consulta Creazione di metriche personalizzate nella documentazione di Cloud Monitoring.
Prometheus personalizzato
Metrica Prometheus personalizzata
Scala in base a una metrica personalizzata definita dall'utente esportata nel formato Prometheus. La metrica Prometheus deve essere di tipo Gauge e non deve contenere il prefisso custom.googleapis.com
.
La scalabilità automatica consente fondamentalmente di trovare un equilibrio accettabile tra costo e latenza. Per trovare una norma adatta alle tue esigenze, ti consigliamo di sperimentare una combinazione di queste metriche e altre.
Obiettivi
Questo tutorial riguarda le attività seguenti:- Come eseguire il deployment dell'adattatore delle metriche personalizzate.
- Come esportare le metriche dal codice dell'applicazione.
- Come visualizzare le metriche nell'interfaccia di Cloud Monitoring.
- Come eseguire il deployment di una risorsa HorizontalPodAutoscaler (HPA) per scalare la tua applicazione in base alle metriche di Cloud Monitoring.
Costi
In questo documento vengono utilizzati i seguenti componenti fatturabili di Google Cloud:
Per generare una stima dei costi in base all'utilizzo previsto,
utilizza il Calcolatore prezzi.
Una volta completate le attività descritte in questo documento, puoi evitare la fatturazione continua eliminando le risorse che hai creato. Per ulteriori informazioni, consulta la pagina Pulizia.
Prima di iniziare
Segui questi passaggi per abilitare l'API Kubernetes Engine:- Visita la pagina Kubernetes Engine nella console Google Cloud.
- Crea o seleziona un progetto.
- Attendi che l'API e i servizi correlati siano abilitati. Questa operazione può richiedere diversi minuti.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.
Puoi seguire questo tutorial utilizzando Cloud Shell, in cui sono preinstallati gli strumenti a riga di comando gcloud
e kubectl
utilizzati in questo tutorial. Se utilizzi Cloud Shell, non è necessario installare questi strumenti a riga di comando sulla workstation.
Per utilizzare Cloud Shell:
- Vai alla console Google Cloud.
Fai clic sul pulsante Attiva Cloud Shell nella parte superiore della finestra della console Google Cloud.
All'interno di un nuovo frame nella parte inferiore della console Google Cloud si apre una sessione di Cloud Shell che mostra un prompt della riga di comando.
Configurazione dell'ambiente
Imposta la zona predefinita per Google Cloud CLI:
gcloud config set compute/zone zone
Sostituisci quanto segue:
zone
: scegli la zona più vicina a te. Per saperne di più, consulta Regioni e zone.
Imposta la variabile di ambiente
PROJECT_ID
sul tuo ID progetto Google Cloud (project-id):export PROJECT_ID=project-id
Imposta la zona predefinita per Google Cloud CLI:
gcloud config set project $PROJECT_ID
Crea un cluster GKE
gcloud container clusters create metrics-autoscaling
Deployment dell'adattatore per le metriche personalizzate
L'adattatore delle metriche personalizzate consente al cluster di inviare e ricevere metriche con Cloud Monitoring.
CPU
Non applicabile: gli Horizontal Pod Autoscaler possono scalare in modo nativo in base all'utilizzo della CPU, quindi non è necessario l'adattatore per le metriche personalizzate.
Pub/Sub
Concedi all'utente la possibilità di creare ruoli di autorizzazione richiesti:
kubectl create clusterrolebinding cluster-admin-binding \
--clusterrole cluster-admin --user "$(gcloud config get-value account)"
Esegui il deployment dell'adattatore del nuovo modello di risorsa sul cluster:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter_new_resource_model.yaml
Metrica personalizzata
Concedi all'utente la possibilità di creare ruoli di autorizzazione richiesti:
kubectl create clusterrolebinding cluster-admin-binding \
--clusterrole cluster-admin --user "$(gcloud config get-value account)"
Esegui il deployment dell'adattatore per modello di risorsa sul cluster:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter_new_resource_model.yaml
Prometheus personalizzato
Concedi all'utente la possibilità di creare ruoli di autorizzazione richiesti:
kubectl create clusterrolebinding cluster-admin-binding \
--clusterrole cluster-admin --user "$(gcloud config get-value account)"
Esegui il deployment dell'adattatore per il modello di risorse legacy sul cluster:
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/k8s-stackdriver/master/custom-metrics-stackdriver-adapter/deploy/production/adapter.yaml
Deployment di un'applicazione con le metriche
Scarica il repository contenente il codice dell'applicazione per questo tutorial:
CPU
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/quickstarts/hello-app
Pub/Sub
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/databases/cloud-pubsub
Metrica personalizzata
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/observability/custom-metrics-autoscaling/direct-to-sd
Prometheus personalizzato
git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
cd kubernetes-engine-samples/observability/custom-metrics-autoscaling/prometheus-to-sd
Il repository contiene codice che esporta le metriche in Cloud Monitoring:
CPU
Questa applicazione risponde "Hello World!" a qualsiasi richiesta web sulla porta 8080
. Le metriche della CPU di Compute Engine vengono raccolte automaticamente da Cloud Monitoring.
Pub/Sub
Questa applicazione esegue il polling di una sottoscrizione Pub/Sub per i nuovi messaggi, confermandoli all'arrivo. Le metriche relative all'abbonamento Pub/Sub vengono raccolte automaticamente da Cloud Monitoring.
Metrica personalizzata
Questa applicazione esporta una metrica del valore costante utilizzando le librerie client di Cloud Monitoring.
Prometheus personalizzato
Questa applicazione esporta una metrica del valore costante utilizzando il formato Prometheus.
Il repository contiene anche un manifest Kubernetes per il deployment dell'applicazione nel cluster:
CPU
Pub/Sub
Metrica personalizzata
Prometheus personalizzato
Esegui il deployment dell'applicazione nel tuo cluster:
CPU
kubectl apply -f manifests/helloweb-deployment.yaml
Pub/Sub
Abilita l'API Pub/Sub sul tuo progetto:
gcloud services enable cloudresourcemanager.googleapis.com pubsub.googleapis.com
Crea un argomento e una sottoscrizione Pub/Sub:
gcloud pubsub topics create echo
gcloud pubsub subscriptions create echo-read --topic=echo
Crea un account di servizio con accesso a Pub/Sub:
gcloud iam service-accounts create autoscaling-pubsub-sa
gcloud projects add-iam-policy-binding $PROJECT_ID \
--member "serviceAccount:autoscaling-pubsub-sa@$PROJECT_ID.iam.gserviceaccount.com" \
--role "roles/pubsub.subscriber"
Scarica il file della chiave dell'account di servizio:
gcloud iam service-accounts keys create key.json \
--iam-account autoscaling-pubsub-sa@$PROJECT_ID.iam.gserviceaccount.com
Importa la chiave dell'account di servizio nel cluster come Secret:
kubectl create secret generic pubsub-key --from-file=key.json=./key.json
Esegui il deployment dell'applicazione nel tuo cluster:
kubectl apply -f deployment/pubsub-with-secret.yaml
Metrica personalizzata
kubectl apply -f custom-metrics-sd.yaml
Prometheus personalizzato
kubectl apply -f custom-metrics-prometheus-sd.yaml
Dopo aver atteso il deployment dell'applicazione, tutti i pod raggiungono lo stato Ready
:
CPU
kubectl get pods
Output:
NAME READY STATUS RESTARTS AGE
helloweb-7f7f7474fc-hzcdq 1/1 Running 0 10s
Pub/Sub
kubectl get pods
Output:
NAME READY STATUS RESTARTS AGE
pubsub-8cd995d7c-bdhqz 1/1 Running 0 58s
Metrica personalizzata
kubectl get pods
Output:
NAME READY STATUS RESTARTS AGE
custom-metric-sd-58dbf4ffc5-tm62v 1/1 Running 0 33s
Prometheus personalizzato
kubectl get pods
Output:
NAME READY STATUS RESTARTS AGE
custom-metric-prometheus-sd-697bf7c7d7-ns76p 2/2 Running 0 49s
Visualizzazione delle metriche su Cloud Monitoring
Durante l'esecuzione, l'applicazione scrive le metriche in Cloud Monitoring.
Per visualizzare le metriche per una risorsa monitorata utilizzando Metrics Explorer, procedi come segue:
-
Nel pannello di navigazione della console Google Cloud, seleziona Monitoring e poi leaderboard Metrics Explorer:
- Nell'elemento Metrica, espandi il menu Seleziona una metrica, quindi seleziona un tipo di risorsa e un tipo di metrica. Ad esempio, per tracciare un grafico dell'utilizzo della CPU di una macchina virtuale:
- (Facoltativo) Per ridurre le opzioni del menu, inserisci parte del nome della metrica nella
barra dei filtri. Per questo esempio, inserisci
utilization
. - Nel menu Risorse attive, seleziona Istanza VM.
- Nel menu Categorie di metriche attive, seleziona Istanza.
- Nel menu Metriche attive, seleziona Utilizzo CPU e fai clic su Applica.
- (Facoltativo) Per ridurre le opzioni del menu, inserisci parte del nome della metrica nella
barra dei filtri. Per questo esempio, inserisci
Per filtrare le serie temporali visualizzate, utilizza l'elemento Filter.
Per combinare le serie temporali, utilizza i menu dell'elemento Aggregazione. Ad esempio, per visualizzare l'utilizzo della CPU per le VM, in base alla loro zona, imposta il primo menu su Media e il secondo su zone.
Tutte le serie temporali vengono visualizzate quando il primo menu dell'elemento Aggregation è impostato su Unaggregated. Le impostazioni predefinite per l'elemento Aggregazione sono determinate dal tipo di metrica selezionato.
Il tipo di risorsa e le metriche sono i seguenti:
CPU
Tipo di risorsa: gce_instance
Metrica: compute.googleapis.com/instance/cpu/utilization
Pub/Sub
Tipo di risorsa: pubsub_subscription
Metrica: pubsub.googleapis.com/subscription/num_undelivered_messages
Metrica personalizzata
Tipo di risorsa: k8s_pod
Metrica: custom.googleapis.com/custom-metric
Prometheus personalizzato
Tipo di risorsa: gke_container
Metrica: custom.googleapis.com/custom_prometheus
Creazione di un oggetto HorizontalPodAutoscaler
Quando vedi la metrica in Cloud Monitoring, puoi eseguire il deployment di un HorizontalPodAutoscaler
per ridimensionare il deployment in base alla metrica.
CPU
Pub/Sub
Metrica personalizzata
Prometheus personalizzato
Esegui il deployment di HorizontalPodAutoscaler
nel cluster:
CPU
kubectl apply -f manifests/helloweb-hpa.yaml
Pub/Sub
kubectl apply -f deployment/pubsub-hpa.yaml
Metrica personalizzata
kubectl apply -f custom-metrics-sd-hpa.yaml
Prometheus personalizzato
kubectl apply -f custom-metrics-prometheus-sd-hpa.yaml
Generazione del carico in corso...
Per alcune metriche, potrebbe essere necessario generare carico per osservare la scalabilità automatica:
CPU
Simula 10.000 richieste al server helloweb
:
kubectl exec -it deployments/helloweb -- /bin/sh -c \
"for i in $(seq -s' ' 1 10000); do wget -q -O- localhost:8080; done"
Pub/Sub
Pubblica 200 messaggi nell'argomento Pub/Sub:
for i in {1..200}; do gcloud pubsub topics publish echo --message="Autoscaling #${i}"; done
Metrica personalizzata
Non applicabile: il codice utilizzato in questo esempio esporta un valore costante di 40
per la metrica personalizzata. HorizontalPodAutoscaler è impostato con un
valore target pari a 20
, quindi tenta di fare automaticamente lo scale up
del deployment.
Prometheus personalizzato
Non applicabile: il codice utilizzato in questo esempio esporta un valore costante di 40
per la metrica personalizzata. HorizontalPodAutoscaler è impostato con un
valore target pari a 20
, quindi tenta di fare automaticamente lo scale up
del deployment.
Osservazione dello scale up di HorizontalPodAutoscaler
Puoi controllare il numero attuale di repliche del tuo deployment eseguendo:
kubectl get deployments
Dopo aver atteso un po' di tempo per la propagazione della metrica, il deployment crea cinque pod per gestire il backlog.
Puoi anche controllare lo stato e l'attività recente di HorizontalPodAutoscaler eseguendo:
kubectl describe hpa
Esegui la pulizia
Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
CPU
Elimina il cluster GKE:
gcloud container clusters delete metrics-autoscaling
Pub/Sub
Esegui la pulizia della sottoscrizione Pub/Sub e dell'argomento:
gcloud pubsub subscriptions delete echo-read gcloud pubsub topics delete echo
Elimina il cluster GKE:
gcloud container clusters delete metrics-autoscaling
Metrica personalizzata
Elimina il cluster GKE:
gcloud container clusters delete metrics-autoscaling
Prometheus personalizzato
Elimina il cluster GKE:
gcloud container clusters delete metrics-autoscaling
Passaggi successivi
Scopri di più sulle metriche personalizzate ed esterne per la scalabilità dei carichi di lavoro.
Esplora altri tutorial su Kubernetes Engine.