Visualizza le metriche di osservabilità


Questa pagina mostra come visualizzare le metriche di stato dell'infrastruttura per i cluster e i carichi di lavoro di Google Kubernetes Engine (GKE). Queste metriche possono aiutarti a risolvere i problemi relativi ai cluster e ai carichi di lavoro GKE.

Metriche di osservabilità per i cluster

Requisiti

  • Le metriche di sistema devono essere abilitate sui cluster per utilizzare le metriche di panoramica nella scheda Osservabilità. Le metriche di sistema sono sempre abilitate nei cluster Autopilot e sono abilitate per impostazione predefinita nei cluster standard.
  • Per utilizzare le metriche del piano di controllo nella scheda Osservabilità, le metriche del piano di controllo devono essere abilitate nei cluster. Se selezioni Piano di controllo nella scheda Osservabilità del cluster e le metriche non sono abilitate, vedrai una notifica che indica che le metriche non sono abilitate. Per abilitarle, fai clic su Abilita pacchetto. Per informazioni su altri modi per abilitare le metriche del piano di controllo, consulta Configurazione della raccolta di metriche del piano di controllo.

Metriche di osservabilità

Nella scheda Osservabilità della console Google Cloud, puoi visualizzare le metriche sulle prestazioni per cluster e carichi di lavoro.

Per l'edizione Google Kubernetes Engine (GKE) Enterprise, i grafici mostrano tutti i cluster di un parco risorse.

Metriche per cluster e carichi di lavoro

Le seguenti metriche sono disponibili sia per i cluster che per i carichi di lavoro:

  • Panoramica: mostra le metriche di riepilogo sullo stato dell'infrastruttura, come l'utilizzo delle richieste di CPU e memoria, i log degli errori e gli eventi di avviso.
  • CPU: mostra l'utilizzo delle richieste di CPU e core.
  • Memoria: mostra l'utilizzo della memoria delle richieste.

Per i cluster sono disponibili le seguenti metriche:

  • Eventi Kubernetes: fornisce visibilità sul conteggio degli eventi nel tempo e un log dettagliato degli eventi.
  • Piano di controllo: offre visibilità sull'integrità dei componenti del piano di controllo Kubernetes, come kube-apiserver e scheduler. Fornisce inoltre informazioni come il numero di pod non pianificabili. È stato effettuato un tentativo di pianificazione dei pod in stato non pianificabile e sono stati considerati non pianificabili. I pod in questo stato indicano che nel cluster non è cambiato nulla che li renda pianificabili.
  • Importazione di Cloud Ops: fornisce visibilità sulla quantità di importazione di metriche e logging correlate ai costi. Per ulteriori informazioni, consulta i prezzi della suite operativa di Google Cloud.
  • Temporaneo: (disponibile nella scheda Osservabilità per un cluster selezionato): fornisce visibilità sullo spazio di archiviazione temporaneo utilizzato da un cluster per consentirti di determinare se lo spazio di archiviazione del cluster viene utilizzato in modo efficiente. Nella pagina Panoramica della scheda Osservabilità, un grafico mostra lo spazio di archiviazione temporaneo utilizzato dal cluster, mentre la pagina Temporanea mostra metriche aggiuntive, tra cui capacità, velocità effettiva, frequenza delle operazioni di I/O e altre. Alcune di queste metriche non sono disponibili per i cluster Autopilot.
  • Persistent: fornisce visibilità sui volumi permanenti e sulle richieste di volumi permanenti.
  • Stato dei carichi di lavoro: fornisce visibilità sui seguenti tipi di risorse: Pod, Deployment, StatefulSet, DaemonSet e Horizontal Pod Autoscaler.
  • GPU (un sottoinsieme di metriche di sistema GKE, compilato solo per cluster con nodi GPU): fornisce visibilità sull'utilizzo delle risorse GPU, compreso l'utilizzo per modello GPU e riepiloghi dei cinque nodi con il massimo e il più basso utilizzo delle risorse.

Interpretare le metriche di osservabilità

Le metriche possono aiutarti a risolvere i problemi relativi ai cluster GKE, ad esempio:

  • Le tendenze di utilizzo di CPU o memoria elevate potrebbero indicare che devi configurare i container in un cluster o spazio dei nomi per utilizzare meno risorse.
  • Un numero elevato di riavvii dei container potrebbe indicare che i container si arrestano in modo anomalo.
  • Un numero elevato di pod non pianificabili indica risorse insufficienti o errori di configurazione.
  • L'importazione di Cloud Logging o Google Cloud Managed Service per Prometheus elevato è correlata al costo della suite operativa di Google Cloud. Potresti risparmiare sui costi riducendo l'importazione. Per ulteriori informazioni su Google Cloud Managed Service per Prometheus, consulta Controllo dei costi e attribuzione. Per ulteriori informazioni sul logging, consulta la sezione Filtri di esclusione.

Visualizza le metriche di osservabilità di cluster e carichi di lavoro

Per visualizzare le metriche di osservabilità per i cluster o i carichi di lavoro, esegui questi passaggi nella console Google Cloud:

  1. Vai alla pagina Cluster Kubernetes o Carichi di lavoro Kubernetes:

    Vai ai cluster Kubernetes

    Vai ai carichi di lavoro Kubernetes

  2. Seleziona la scheda Osservabilità.

  3. Scegli il periodo di tempo durante il quale le metriche vengono aggregate. Trascina all'interno di un grafico per concentrarti su un intervallo di tempo specifico. Fai clic su Reimposta zoom per tornare all'intervallo selezionato in precedenza.

Per visualizzare le metriche di osservabilità per un cluster o un carico di lavoro selezionato, esegui questi passaggi nella console Google Cloud:

  1. Vai alla pagina Cluster Kubernetes o Carichi di lavoro Kubernetes:

    Vai ai cluster Kubernetes

    Vai ai carichi di lavoro Kubernetes

  2. Fai clic sul nome di un cluster o di un carico di lavoro.

  3. Seleziona la scheda Osservabilità.

  4. Scegli il periodo di tempo durante il quale le metriche vengono aggregate. Trascina all'interno di un grafico per concentrarti su un intervallo di tempo specifico. Fai clic su Reimposta zoom per tornare all'intervallo selezionato in precedenza.

Crea una dashboard personalizzata da una vista selezionata

Per aggiungere i grafici visibili a una dashboard personalizzabile in Cloud Monitoring, esegui questi passaggi nella console Google Cloud:

  1. Vai alla pagina Cluster Kubernetes o Carichi di lavoro Kubernetes:

    Vai ai cluster Kubernetes

    Vai ai carichi di lavoro Kubernetes

  2. Seleziona la scheda Osservabilità.

  3. (Facoltativo) Seleziona i filtri per i dati.

  4. Fai clic su Salva come dashboard personalizzata.

  5. Specifica un nome per la nuova dashboard.

  6. Fai clic su Invia per creare una nuova dashboard.

  7. Fai clic su Visualizza in Monitoring per visualizzare la dashboard.

Visualizza le dashboard GKE in Cloud Monitoring

Monitoring fornisce dashboard aggiuntive per GKE e altri servizi Google Cloud. Puoi utilizzare le dashboard fornite o crearne una copia per personalizzarla in base alle tue esigenze.

L'elenco delle dashboard include anche i playbook GKE che puoi utilizzare per risolvere i problemi comuni.

  1. Nella console Google Cloud, seleziona Monitoring, quindi seleziona  Dashboard oppure fai clic sul pulsante seguente:

    Vai alle dashboard

  2. Nell'elenco Categorie, seleziona G C P.

  3. Seleziona la dashboard o il playbook che vuoi visualizzare.

    • La dashboard di GKE fornisce una panoramica dei cluster, dei carichi di lavoro, dei servizi e di altre risorse che puoi filtrare. Puoi fare clic su una risorsa per visualizzare i dettagli della metrica e del log. Per spazi dei nomi, worloads e servizi Kubernetes, puoi anche visualizzare e creare obiettivi del livello di servizio (SLO) dalla visualizzazione dei dettagli.
    • Altre dashboard e playbook GKE sono incentrati su risorse o condizioni specifiche, come i carichi di lavoro a rischio.

Passaggi successivi