Osservazione dei cluster GKE

Questa pagina descrive come accedere alle dashboard di monitoraggio di Cloud Operations for GKE e Logging legacy e Monitoring e come utilizzare la dashboard di monitoraggio di Cloud Operations for GKE.

Accesso alla dashboard di monitoraggio

  1. Da Cloud Console, vai a Monitoring:

    Vai a Monitoring

  2. Seleziona Dashboard e scegli una delle seguenti dashboard:

    • Per i cluster con Cloud Operations for GKE abilitato, seleziona la dashboard denominata GKE.

    • Per i cluster con Logging e Monitoring legacy abilitati, seleziona la dashboard denominata Cluster GKE.

    Se non vedi alcun cluster o se non vedi tutte le risorse nei tuoi cluster, consulta la sezione Risoluzione dei problemi della dashboard di GKE.

Interfaccia dashboard di Cloud Operations for GKE

La dashboard Cloud Operations for GKE è suddivisa in diverse parti:

Visualizza la visualizzazione tabella della dashboard di Cloud Operations for GKE.

  1. La barra dei filtri ti consente di selezionare le risorse GKE in base alle quali applicare il filtro all'interno della dashboard.

  2. La sequenza temporale degli avvisi ti consente di selezionare un intervallo di tempo specifico per la dashboard e mostra un riepilogo degli avvisi che si sono verificati in quel periodo di tempo.

  3. Le tabelle mostrano il parco risorse GKE per tipo: cluster, spazio dei nomi, nodo, carichi di lavoro, servizi, pod e container. Ogni riga mostra una singola risorsa con metriche. Se fai clic su una riga viene visualizzato un riquadro con ulteriori dettagli sulla risorsa.

Barra dei filtri

La barra dei filtri ti consente di filtrare le risorse GKE mostrate nella dashboard per visualizzare i dati di tuo interesse. Visualizza inoltre le informazioni di altre risorse nel cluster correlate ai filtri selezionati.

Utilizzare la barra dei filtri

Per filtrare i dati nella dashboard, procedi nel seguente modo.

  1. Fai clic sulla barra dei filtri per visualizzare le opzioni di filtro.

    Visualizza le opzioni di filtro.

  2. Seleziona una risorsa Kubernetes in base alla quale applicare un filtro, quindi seleziona il nome della risorsa.

    Se è presente più di una risorsa con questo nome, seleziona l'istanza della risorsa specifica in base alla quale applicare un filtro.

  3. Fai clic su Applica.

    La Dashboard si aggiorna per visualizzare le informazioni aggiornate.

Quando utilizzi la barra dei filtri, tieni presente quanto segue:

  • Dopo aver applicato un filtro alla dashboard, puoi fare nuovamente clic sulla barra per filtrare in base a risorse aggiuntive.

  • Alcune risorse potrebbero avere troppe opzioni da visualizzare nel menu dei filtri. In questo caso, devi prima filtrare in base a una risorsa padre per limitare le opzioni. Ad esempio, potresti avere troppi pod da visualizzare, quindi potresti prima filtrare per cluster o qualsiasi altra risorsa Kubernetes per restringere l'elenco dei pod.

  • Per chiarire l'ambito di ciascuna stringa di filtro, l'interfaccia del filtro potrebbe visualizzare filtri aggiuntivi per impostazione predefinita, in base alla risorsa scelta per il filtro. Ad esempio, se filtri in base a uno spazio dei nomi specifico, il filtro aggiunge il cluster in cui si trova lo spazio dei nomi.

    Mostra opzioni di filtro aggiuntive selezionate dal sistema.

Sequenza temporale avvisi

La sequenza temporale degli avvisi offre una visualizzazione degli avvisi nei cluster. La sequenza temporale degli avvisi ti mostra una panoramica delle violazioni degli avvisi che si sono verificate nell'intervallo di tempo selezionato. Se posizioni il puntatore su un'area rossa nella sequenza temporale, vengono visualizzate le schede degli eventi.

Utilizzo della visualizzazione cronologia di un avviso Kubernetes.

Ogni scheda degli eventi fornisce informazioni dettagliate su un avviso visualizzato nella sequenza temporale.

Il menu a discesa del periodo di tempo ti consente di impostare il periodo di tempo per la sequenza temporale degli avvisi e per le tabelle nella tua dashboard.

Utilizzare le schede degli eventi

Quando passi il mouse sopra la sequenza temporale degli avvisi, nella dashboard vengono visualizzate le schede degli eventi per ciascuna violazione. Un avviso con indica che l'incidente è ancora aperto, mentre un avviso con indica che l'incidente è chiuso.

Se l'intervallo di tempo selezionato ha più di 2 avvisi, puoi utilizzare la rotellina del mouse per scorrere le schede degli eventi. Puoi anche fare clic su Visualizza tutti gli avvisi per visualizzare tutte le schede degli eventi in un riquadro.

Per visualizzare l'incidente in modalità di avviso, fai clic su Visualizza incidente.

Nella sezione Risorsa associata, la scheda dell'evento mostra la risorsa a cui è associato l'avviso. Se la dashboard non può determinare a quale risorsa è associato l'avviso, la scheda dell'evento fornisce un link Aggiorna criterio di avviso, che ti indirizza alla pagina Modifica criterio di avviso. Da qui puoi aggiornare il criterio di avviso con informazioni aggiuntive in modo che la dashboard possa trovare la risorsa associata.

Tabelle della dashboard

La dashboard visualizza una tabella di metriche per ogni risorsa GKE. Nelle tabelle vengono visualizzate le seguenti colonne:

  • Nome: il nome visualizzato della risorsa.

  • Avvisi: il numero di avvisi aperti e confermati per la risorsa e dei relativi elementi secondari verificatisi nell'intervallo di tempo selezionato.

  • Obiettivi del livello di servizio (SLO): una dichiarazione delle prestazioni volute per i servizi, misurata mediante l'indicatore del livello di servizio (SLI).

  • Riavvii dei container: il numero di volte in cui un container è stato riavviato entro l'intervallo di tempo selezionato.

  • Log degli errori: il numero di log degli errori associati a un'entità in base all'intervallo di tempo selezionato.

  • Utilizzo CPU: l'utilizzo della CPU dei container che può essere attribuito a una risorsa nell'intervallo di tempo selezionato.

  • Utilizzo memoria: l'utilizzo della memoria dei container che può essere attribuito a una risorsa entro l'intervallo di tempo selezionato.

    • La metrica utilizzata è kubernetes.io/container/memory/request_utilization. Esistono due tipi di memoria: evibile e non eliminabile. La memoria eliminabile è la memoria che viene rimossa dalla risorsa se l'utilizzo diventa troppo elevato. Se l'utilizzo di memoria non eliminabile supera i limiti, il container potrebbe essere chiuso. Per ulteriori informazioni sui limiti delle risorse, consulta l'articolo Richieste e limiti.
  • Utilizzo del disco: l'utilizzo del disco di pod che può essere attribuito a una risorsa entro l'intervallo di tempo selezionato. A differenza delle due colonne precedenti, questa metrica viene creata dai pod e non viene visualizzata nella tabella Container.

Per le colonne di utilizzo, tieni presente quanto segue:

  • Queste colonne non mostrano un rapporto, ma mostrano due punti dati diversi, separati da una barra (/). Il primo numero mostra la capacità totale richiesta per quella singola risorsa. Il secondo numero mostra l'utilizzo percentuale della capacità richiesta.

  • Gli sparkline mostrano i dati di utilizzo nell'intervallo di tempo selezionato nella pagina.

Configurazione delle tabelle della dashboard

Puoi configurare le tabelle nella dashboard in modo che mostrino le informazioni che ti interessano di più. Utilizza il menu a discesa Configura tabelle risorse accanto alla barra dei filtri per selezionare le colonne da visualizzare. Puoi anche scegliere se mostrare o meno i grafici sparkline nelle tabelle.

Tieni presente che queste configurazioni si applicano a tutte le tabelle nella dashboard.

Visualizzazione del menu a discesa Configura le tabelle delle risorse.

Per configurare le tabelle:

  1. Seleziona il menu a discesa Configura le tabelle delle risorse.

  2. Seleziona le colonne da visualizzare nelle tabelle.

    Le colonne Nome e Avvisi attivi sono obbligatorie.

  3. Scegli se mostrare o meno i sparkline.

  4. Fai clic su Applica per apportare le modifiche.

Visualizzazione dei dettagli delle risorse

Per impostazione predefinita, nella dashboard di Cloud Operations for GKE viene visualizzata una riga di riepilogo per ogni risorsa Kubernetes. Se fai clic su una riga in una tabella, vengono visualizzati i dettagli della risorsa.

Visualizzazione dei dettagli di una risorsa.

Il riquadro dei dettagli della risorsa mostra informazioni sulla risorsa selezionata. Fornisce anche una scheda Avvisi che mostra informazioni sugli avvisi aperti, una scheda Eventi che mostra gli eventi Kubernetes associati alla risorsa selezionata, una scheda Metriche che mostra le metriche nei grafici e una scheda Log che visualizza i log generati dalla risorsa.

Per visualizzare l'incidente in Avvisi, fai clic su Visualizza avvisi.

Visualizzazione di eventi Kubernetes

La scheda Eventi nel riquadro dei dettagli della risorsa mostra gli eventi Kubernetes associati alla risorsa. Gli eventi Kubernetes sono disponibili per tutte le risorse, ad eccezione dei container.

Visualizzazione di una scheda Evento per i dettagli di una risorsa.

La scheda Eventi contiene una serie di schede che mostrano informazioni su ciascun evento. Una scheda fornisce anche un link alla risorsa associata se l'evento si è verificato in una risorsa inferiore. Puoi fare clic su Visualizza log per aprire lo strumento Esplora log per visualizzare il log associato all'evento. Puoi anche fare clic su Copia messaggio per copiare il messaggio di log negli appunti.

Per visualizzare tutti gli eventi in Esplora log, fai clic su Visualizza in Logging. Esplora log si apre e mostra tutti i log associati agli eventi Kubernetes.

Gestione degli SLO

Puoi monitorare l'integrità e le prestazioni delle tue applicazioni utilizzando gli obiettivi del livello di servizio (SLO). Dopo aver configurato la dashboard per visualizzare la colonna Obiettivi del livello di servizio (SLO), puoi vedere se le tue applicazioni soddisfano gli SLO. Lo SLO della tua risorsa potrebbe avere uno dei seguenti stati:

  • Stato integro: indica che la risorsa soddisfa lo SLO specificato. Questo stato ha un indicatore verde.

  • Non rientra nel budget di errore: indica che la risorsa ha esaurito il budget di errore, il che significa che altri eventi non validi potrebbero causare la violazione dello SLO della risorsa. Questo stato ha un indicatore giallo.

  • Stato non integro: indica che la risorsa è al di fuori dello SLO e presenta un avviso che si attiva. Questo stato ha un indicatore rosso.

  • Nessuno stato: indica che non esistono dati per lo SLO. Questo stato ha un indicatore grigio.

Per ulteriori informazioni su questi concetti, consulta Concetti nel monitoraggio dei servizi.

Dettagli SLO

Puoi definire SLO per le seguenti risorse Kubernetes: spazi dei nomi, carichi di lavoro e servizi Kubernetes. Per visualizzare le informazioni dettagliate sulla conformità SLO della risorsa, fai clic sulla risorsa per aprire il riquadro dei dettagli. Nel riquadro dei dettagli, fai clic sulla scheda SLOS.

Visualizzazione della scheda SLO nel riquadro dei dettagli.

Crea SLO

Puoi creare uno SLO per la tua risorsa Kubernetes dalla dashboard di monitoraggio di Cloud Operations for GKE.

Nella pagina Dashboard GKE, fai clic su nella riga della risorsa Kubernetes per aprire il riquadro Crea un obiettivo del livello di servizio (SLO).

Nel riquadro dei dettagli della risorsa, fai clic su Crea SLO per aprire il riquadro Crea un obiettivo del livello di servizio (SLO).

Visualizzazione del riquadro di creazione degli SLO.

Per informazioni sul completamento del modulo per creare uno SLO, consulta la guida Creazione di uno SLO.

Visualizzazione dei log in Esplora log

Puoi cercare e visualizzare i dati di log del tuo cluster tramite Esplora log. Con Esplora log puoi visualizzare i log, analizzare e analizzare i dati dei log e perfezionare i parametri di ricerca.

Per ulteriori dettagli, consulta la documentazione di Logging sull'utilizzo di Esplora log.

Risolvere i problemi

Per informazioni sulla risoluzione dei problemi, consulta la sezione Risoluzione dei problemi della dashboard di GKE.