Configurazione della raccolta di metriche


Questo documento descrive come configurare Google Kubernetes Engine (GKE) per inviare metriche a Cloud Monitoring. Le metriche in Cloud Monitoring possono completare dashboard personalizzate, generare avvisi, creare obiettivi del livello di servizio o essere recuperate da servizi di monitoraggio di terze parti utilizzando l'API Cloud Monitoring.

GKE fornisce diverse origini di metriche:

  • Metriche di sistema: metriche di componenti di sistema essenziali che descrivono risorse di basso livello come CPU, memoria e spazio di archiviazione.
  • Google Cloud Managed Service per Prometheus: consente di monitorare e creare avvisi sui carichi di lavoro utilizzando Prometheus, senza dover gestire e utilizzare Prometheus manualmente su larga scala.
  • Pacchetti di metriche di osservabilità:

    • Metriche del piano di controllo: metriche esportate da determinati componenti del piano di controllo, ad esempio il server API e lo scheduler.
    • Metriche di stato Kube: un insieme selezionato di metriche esportate dal servizio kube state, utilizzato per monitorare lo stato degli oggetti Kubernetes come pod, deployment e altro ancora. Per l'insieme delle metriche incluse, consulta Utilizzare le metriche di stato kube.

      Il pacchetto di stati kube è una soluzione gestita. Se hai bisogno di maggiore flessibilità, ad esempio se hai bisogno di raccogliere metriche aggiuntive o di gestire intervalli di scrape o di scraping di altre risorse, puoi disabilitare il pacchetto, se è abilitato, ed eseguire il deployment della tua istanza del servizio di metriche di stato open source kube. Per ulteriori informazioni, consulta la documentazione dell'esportatore di Google Cloud Managed Service per Prometheus per le metriche dello stato di Kube.

    • cAdvisor/Kubelet: un insieme selezionato di metriche cAdvisor e Kubelet. Per l'insieme di metriche incluse, consulta Utilizzare le metriche di cAdvisor/Kubelet.

      Il pacchetto cAdvisor/Kubelet è una soluzione gestita. Se hai bisogno di maggiore flessibilità, ad esempio se hai bisogno di raccogliere metriche aggiuntive o di gestire intervalli di scrape o di scraping di altre risorse, puoi disabilitare il pacchetto, se è abilitato, ed eseguire il deployment della tua istanza dei servizi delle metriche open source cAdvisor/Kubelet. Per ulteriori informazioni, consulta la documentazione di Google Cloud Managed Service per Prometheus per l'esportatore di cAdvisor/Kubelet.

    • Metriche di NVIDIA Data Center GPU Manager (DCGM): metriche di DCGM che offrono una visione completa dell'integrità, delle prestazioni e dell'utilizzo della GPU.

Metriche di sistema

Quando viene creato un cluster, GKE raccoglie per impostazione predefinita alcune metriche emesse dai componenti di sistema.

Puoi scegliere se inviare o meno le metriche dal cluster GKE a Cloud Monitoring. Se scegli di inviare le metriche a Cloud Monitoring, devi inviare le metriche di sistema.

Tutte le metriche di sistema GKE vengono importate in Cloud Monitoring con il prefisso kubernetes.io.

Prezzi

Cloud Monitoring non addebita alcun costo per l'importazione delle metriche di sistema di GKE. Per ulteriori informazioni, consulta i prezzi di Cloud Monitoring.

Configurazione della raccolta delle metriche di sistema

Per abilitare la raccolta delle metriche di sistema, passa il valore SYSTEM al flag --monitoring dei comandi gcloud container clusters create o gcloud container clusters update.

Per disabilitare la raccolta delle metriche di sistema, utilizza il valore NONE per il flag --monitoring. Se la raccolta delle metriche di sistema è disabilitata, informazioni di base come utilizzo della CPU, utilizzo della memoria e utilizzo del disco non sono disponibili per un cluster nella scheda Osservabilità o nella sezione GKE della console Google Cloud.

Per i cluster GKE Autopilot, non puoi disabilitare la raccolta delle metriche di sistema.

Consulta Observability per GKE per ulteriori dettagli sull'integrazione di Cloud Monitoring con GKE.

Per configurare la raccolta di metriche di sistema mediante Terraform, vedi il blocco monitoring_config nel registro Terraform per google_container_cluster. Per informazioni generali sull'utilizzo di Google Cloud con Terraform, consulta Terraform with Google Cloud.

Elenco delle metriche di sistema

Le metriche di sistema includono metriche di componenti di sistema essenziali, importanti per Kubernetes. Per un elenco di queste metriche, consulta Metriche di sistema di GKE.

Se abiliti Cloud Monitoring per il cluster, non puoi disabilitare il monitoraggio del sistema (--monitoring=SYSTEM).

Metriche abilitate per impostazione predefinita in GKE Enterprise

Nelle tabelle seguenti, un segno di spunta () indica quali metriche sono abilitate per impostazione predefinita quando crei e registri un nuovo cluster in un progetto in cui è abilitato GKE Enterprise:

Nome metrica Autopilot Standard
Sistema
Server API
Scheduler
Gestore del controller
Volume permanente (archiviazione)
i pod
Deployment
StatefulState
DaemonSet
HorizonalPodAutoscaler
cAdvisor
Kubelet
Metriche NVIDIA Data Center GPU Manager (DCGM)

Tutti i cluster registrati in un progetto in cui è abilitato GKE Enterprise possono utilizzare i pacchetti per le metriche del piano di controllo, le metriche di stato kube e le metriche cAdvisor/kubelet senza costi aggiuntivi. In caso contrario, queste metriche sono soggette ad addebiti di Cloud Monitoring.

Risoluzione dei problemi relativi alle metriche di sistema

Se le metriche di sistema non sono disponibili in Cloud Monitoring come previsto, consulta Risolvere i problemi relativi alle metriche di sistema.

Pacchetto: Metriche del piano di controllo

Puoi configurare un cluster GKE per inviare a Cloud Monitoring alcune metriche emesse dal server API, dallo scheduler e dal gestore del controller Kubernetes.

Per maggiori informazioni, consulta Raccogliere e visualizzare le metriche del piano di controllo.

Pacchetto: metriche di stato kube

Puoi configurare un cluster GKE per inviare un set selezionato di metriche di stato kube in formato Prometheus a Cloud Monitoring. Questo pacchetto di metriche di stato kube include metriche per pod, deployment, StatefulSet, DaemonSet, risorse HorizontalPodAutoscaler, volumi permanenti e attestazioni di volumi permanenti.

Per maggiori informazioni, consulta Raccogliere e visualizzare le metriche dello stato kube.

Pacchetto: metriche cAdvisor/Kubelet

Puoi configurare un cluster GKE per inviare un set selezionato di metriche cAdvisor/Kubelet in formato Prometheus a Cloud Monitoring. L'insieme selezionato di metriche è un sottoinsieme dell'ampio insieme di metriche cAdvisor/Kubelet integrate in ogni deployment Kubernetes per impostazione predefinita. La selezione di cAdvisor/Kubelet è progettata per fornire le metriche più utili, riducendo il volume di importazione e i costi associati.

Per ulteriori informazioni, consulta Raccogliere e visualizzare le metriche di cAdvisor/Kubelet.

Pacchetto: metriche NVIDIA Data Center GPU Manager (DCGM)

Puoi monitorare l'utilizzo, le prestazioni e l'integrità della GPU configurando GKE per inviare le metriche di NVIDIA Data Center GPU Manager (DCGM) a Cloud Monitoring.

Per maggiori informazioni, consulta Raccogliere e visualizzare le metriche di NVIDIA Data Center GPU Manager (DCGM).

Disabilita pacchetti di metriche

Puoi disabilitare l'utilizzo dei pacchetti di metriche nel cluster. Potrebbe essere utile disabilitare determinati pacchetti per ridurre i costi o utilizzare un meccanismo alternativo per raccogliere le metriche, ad esempio Google Cloud Managed Service per Prometheus e un esportatore.

Console

Per disabilitare la raccolta delle metriche dalla scheda Dettagli per il cluster:

  1. Nella console Google Cloud, vai alla pagina Cluster Kubernetes:

    Vai a Cluster Kubernetes

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato il cui sottotitolo è Kubernetes Engine.

  2. Fai clic sul nome del cluster.

  3. Nella riga Funzionalità con etichetta Cloud Monitoring, fai clic sull'icona Modifica.

  4. Nel menu a discesa Componenti, cancella i componenti della metrica da disattivare.

  5. Fai clic su Ok.

  6. Fai clic su Salva modifiche.

gcloud

  1. Apri una finestra del terminale con Google Cloud SDK e Google Cloud CLI installati. Un modo per farlo è utilizzare Cloud Shell.

  2. Nella console Google Cloud, attiva Cloud Shell.

    Attiva Cloud Shell

    Nella parte inferiore della console Google Cloud viene avviata una sessione di Cloud Shell che mostra un prompt della riga di comando. Cloud Shell è un ambiente shell con Google Cloud CLI già installato e con valori già impostati per il progetto attuale. L'inizializzazione della sessione può richiedere alcuni secondi.

  3. Richiama il comando gcloud container clusters update e passa un insieme aggiornato di valori al flag --monitoring. L'insieme di valori fornito al flag --monitoring sostituisce qualsiasi impostazione precedente.

    Ad esempio, per disattivare la raccolta di tutte le metriche tranne quelle di sistema, esegui questo comando:

    gcloud container clusters update CLUSTER_NAME \
        --location=COMPUTE_LOCATION \
        --enable-managed-prometheus \
        --monitoring=SYSTEM
    

    Questo comando disabilita la raccolta di eventuali pacchetti di metriche configurati in precedenza.

Terraform

Per configurare la raccolta di metriche mediante Terraform, vedi il blocco monitoring_config nel registro Terraform per google_container_cluster. Per informazioni generali sull'utilizzo di Google Cloud con Terraform, consulta Terraform with Google Cloud.

Informazioni sulla fattura di Monitoring

Puoi usare Cloud Monitoring per identificare le metriche del piano di controllo o di stato Kubernetes che scrivono il maggior numero di campioni. Queste metriche contribuiscono maggiormente ai tuoi costi. Dopo aver identificato le metriche più costose, puoi modificare le configurazioni di scrape per filtrarle in modo appropriato.

La pagina Gestione delle metriche di Cloud Monitoring fornisce informazioni che possono aiutarti a controllare l'importo speso per le metriche addebitabili senza influire sull'osservabilità. La pagina Gestione delle metriche riporta le seguenti informazioni:

  • Volumi di importazione per la fatturazione basata sia su byte che su campioni, nei domini delle metriche e per singole metriche.
  • Dati su etichette e cardinalità delle metriche.
  • Utilizzo di metriche nei criteri di avviso e nelle dashboard personalizzate.
  • Percentuale di errori di scrittura delle metriche.

Per visualizzare la pagina Gestione delle metriche, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina  Gestione delle metriche:

    Vai a Gestione delle metriche

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.

  2. Nella barra degli strumenti, seleziona la finestra temporale. Per impostazione predefinita, la pagina Gestione delle metriche mostra informazioni sulle metriche raccolte il giorno precedente.

Per saperne di più sulla pagina Gestione delle metriche, consulta Visualizzare e gestire l'utilizzo delle metriche.

Per identificare le metriche del piano di controllo o di stato kube con il maggior numero di campioni importati:

  1. Nella console Google Cloud, vai alla pagina  Gestione delle metriche:

    Vai a Gestione delle metriche

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.

  2. Nel prospetto Campioni fatturabili importati, fai clic su Visualizza grafici.

  3. Individua il grafico Importazione del volume dello spazio dei nomi e fai clic su  Altre opzioni del grafico.

  4. Nel campo Metrica, verifica che siano selezionate le risorse e le metriche seguenti:
    Metric Ingestion Attribution e Samples written by attribution id.

  5. Nella pagina Filtri, procedi nel seguente modo:

    1. Nel campo Etichetta, verifica che il valore sia attribution_dimension.

    2. Nel campo Confronto, verifica che il valore sia = (equals).

    3. Nel campo Valore, seleziona cluster.

  6. Deseleziona l'impostazione Raggruppa per.

  7. Facoltativamente, filtra solo in base a determinate metriche. Ad esempio, le metriche server API del piano di controllo includono tutte "apiserver" come parte del nome della metrica, mentre le metriche dei pod di stato kube includono "kube_pod" come parte del nome della metrica, quindi puoi filtrare le metriche contenenti quelle stringhe:

    • Fai clic su Aggiungi filtro.

    • Nel campo Etichetta, seleziona metric_type.

    • Nel campo Confronto, seleziona =~ (equals regex).

    • Nel campo Valore, inserisci .*apiserver.* o .*kube_pod.*.

  8. Facoltativamente, raggruppa il numero di campioni importati dalla regione o dal progetto GKE:

    • Fai clic su Raggruppa per.

    • Assicurati che metric_type sia selezionato.

    • Per eseguire il raggruppamento in base alla regione GKE, seleziona Località.

    • Per raggruppare per progetto, seleziona project_id.

    • Fai clic su Ok.

  9. Facoltativamente, raggruppa il numero di campioni importati dal nome del cluster GKE:

    • Fai clic su Raggruppa per.

    • Per raggruppare in base al nome del cluster GKE, assicurati che siano selezionati sia attribution_dimension e attribution_id.

    • Fai clic su Ok.

  10. Per visualizzare il volume di importazione per ciascuna delle metriche, seleziona Entrambe nel pulsante di attivazione/disattivazione con etichetta Tabella entrambe le tabelle. La tabella mostra il volume importato per ogni metrica nella colonna Valore.

    Fai clic due volte sull'intestazione della colonna Valore per ordinare le metriche in base al volume di importazione.

Questi passaggi mostrano le metriche con la percentuale più alta di campioni importati in Cloud Monitoring. Poiché le metriche nei pacchetti di osservabilità vengono addebitate in base al numero di campioni importati, presta attenzione alle metriche con la percentuale maggiore di campioni importati.

Altre metriche

Oltre alle metriche di sistema e ai pacchetti di metriche descritti in questo documento, sono disponibili anche le metriche Istio per i cluster GKE. Per informazioni sui prezzi, consulta i prezzi di Cloud Monitoring.

Metriche disponibili

La seguente tabella indica i valori supportati per il flag --monitoring per i comandi create e update.

Origine Valore --monitoring Metriche raccolte
Nessuna NONE Nessuna metrica inviata a Cloud Monitoring; nessun agente di raccolta delle metriche installato nel cluster. Questo valore non è supportato per i cluster Autopilot.
Sistema SYSTEM Metriche dei componenti di sistema essenziali richiesti per Kubernetes. Per un elenco completo delle metriche, consulta Metriche Kubernetes.
Server API API_SERVER Metriche di kube-apiserver. Per un elenco completo delle metriche, consulta le metriche del server API.
Scheduler SCHEDULER Metriche di kube-scheduler. Per un elenco completo delle metriche, consulta Metriche dello scheduler.
Gestore del titolare CONTROLLER_MANAGER Metriche di kube-controller-manager. Per un elenco completo delle metriche, consulta Metriche del gestore del controller.
Volume permanente (archiviazione) STORAGE Metriche di archiviazione di kube-state-metrics. Include le metriche per le attestazioni di volumi permanenti e di volumi permanenti. Per un elenco completo delle metriche, consulta Metriche di archiviazione.
Pod POD Metriche pod da kube-state-metrics. Per un elenco completo delle metriche, consulta Metriche dei pod.
Deployment DEPLOYMENT Metriche di deployment da kube-state-metrics. Per un elenco completo delle metriche, consulta Metriche di deployment.
StatefulSet STATEFULSET Metriche StatefulSet di kube-state-metrics. Per un elenco completo delle metriche, consulta Metriche StatefulSet.
DaemonSet DAEMONSET Metriche DaemonSet di kube-state-metrics. Per un elenco completo delle metriche, consulta Metriche DaemonSet.
HorizonalPodAutoscaler HPA Metriche HPA di kube-state-metrics. Consulta un elenco completo delle metriche di HorizonalPodAutoscaler.
cAdvisor CADVISOR Metriche di cAdvisor del pacchetto di metriche cAdvisor/Kubelet. Per un elenco completo delle metriche, consulta Metriche di cAdvisor.
kubelet KUBELET Metriche kubelet di cAdvisor/Kubelet Per un elenco completo delle metriche, consulta Metriche kubelet.
Metriche NVIDIA Data Center GPU Manager (DCGM) DCGM Metriche di NVIDIA Data Center GPU Manager (DCGM).

Puoi anche raccogliere metriche in stile Prometheus esposte da qualsiasi carico di lavoro GKE utilizzando Google Cloud Managed Service per Prometheus, che consente di monitorare e creare avvisi sui carichi di lavoro utilizzando Prometheus, senza dover gestire e utilizzare manualmente Prometheus su larga scala.

Passaggi successivi