Monitorare le istanze con Cloud Monitoring

Questo documento descrive come utilizzare la console Cloud Monitoring per monitorare le istanze Spanner.

La console Cloud Monitoring fornisce diversi strumenti di monitoraggio per Spanner:

Se preferisci monitorare Spanner in modo programmatico, utilizza le librerie client Cloud per Cloud Monitoring per recuperare le metriche.

Utilizzare la dashboard selezionata di Cloud Monitoring

Cloud Monitoring fornisce una dashboard selezionata che riassume le informazioni chiave sulle tue istanze Spanner, tra cui:

  • Incidenti: avvisi di monitoraggio creati dall'utente aperti, attivi o risolti
  • Eventi: un elenco di log di controllo di Spanner (se abilitati e disponibili).
  • Istanze: un riepilogo generale delle istanze Spanner, tra cui la capacità di calcolo, il numero di database e lo stato di integrità delle istanze
  • Grafici aggregati del throughput e dell'utilizzo dello spazio di archiviazione

Per visualizzare la dashboard di Spanner:

  1. Nella console Google Cloud, seleziona Monitoraggio o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzata l'opzione Risorse, seleziona Risorse, quindi Cloud Spanner. In caso contrario, seleziona Dashboard e poi la dashboard Cloud Spanner.

Visualizza i dettagli dell'istanza e del database

Quando apri la dashboard selezionata per Spanner, vengono mostrati i dati aggregati di tutte le tue istanze. Puoi visualizzare ulteriori dettagli su un'istanza specifica facendo clic sul nome dell'istanza in Istanze.

La dashboard mostra informazioni quali metadati dell'istanza, database nell'istanza e grafici di varie metriche suddivise per regione.

Nella pagina della dashboard dell'istanza puoi anche visualizzare i grafici per un database specifico nell'istanza:

  1. Sul lato destro, sopra i grafici delle metriche delle istanze, fai clic su Metriche del database.

  2. Nell'elenco a discesa Seleziona un'analisi, seleziona il database che vuoi esaminare.

    La console Cloud Monitoring mostra i grafici per il database.

Creare grafici personalizzati per le metriche di Spanner

Puoi utilizzare Cloud Monitoring per creare grafici personalizzati per le metriche di Spanner. Puoi utilizzare Esplora metriche per creare grafici temporanei ad hoc o grafici visualizzati nelle dashboard personalizzate.

In particolare, Cloud Monitoring ti consente di creare un grafico personalizzato che mostra se due o più metriche sono correlate tra loro. Ad esempio, puoi verificare la presenza di una correlazione tra utilizzo della CPU e latenza in un'istanza Spanner, il che potrebbe indicare che la tua istanza ha bisogno di più capacità di calcolo o che alcune delle tue query stanno causando un elevato utilizzo della CPU.

Per iniziare a utilizzare questo esempio, segui questi passaggi:

  1. Nella console Google Cloud, seleziona Monitoraggio o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzato Metrics Explorer, selezionalo. In caso contrario, seleziona Risorse e poi Esplora metriche.

  3. Fai clic sulla scheda Opzioni di visualizzazione, quindi seleziona la casella di controllo Scala logaritmica sull'asse Y. Questa opzione ti consente di confrontare più metriche quando una ha valori molto più elevati rispetto alle altre.

  4. Nell'elenco a discesa sopra il riquadro a destra, seleziona Riga.

  5. Fai clic sulla scheda Metriche. Ora puoi aggiungere metriche al grafico.

Per aggiungere le metriche sulla latenza al grafico:

  1. Nella casella Find resource type and metric (Trova tipo di risorsa e metrica), inserisci il valore spanner.googleapis.com/api/request_latencies, quindi fai clic sulla riga visualizzata sotto la casella.
  2. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  3. Nell'elenco a discesa Aggregatore, fai clic su Massimo.
  4. (Facoltativo) Modifica il percentile della latenza:

    1. Fai clic su Mostra opzioni avanzate.
    2. Fai clic sull'elenco a discesa Allineatore e poi sul percentile di latenza che vuoi visualizzare.

      Nella maggior parte dei casi, devi esaminare la latenza del 50° percentile per comprendere la quantità tipica di latenza o la latenza del 99° percentile per comprendere la latenza dell'1% di richieste più lente.

Per aggiungere le metriche relative all'utilizzo della CPU al grafico:

  1. Fai clic su Aggiungi metrica.
  2. Nella casella Find resource type and metric (Trova tipo di risorsa e metrica), inserisci il valore spanner.googleapis.com/instance/cpu/utilization, quindi fai clic sulla riga visualizzata sotto la casella.
  3. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  4. Nell'elenco a discesa Aggregatore, fai clic su Massimo.

Ora hai un grafico che mostra le metriche di utilizzo della CPU e di latenza per un'istanza Spanner. Se contemporaneamente entrambe le metriche sono superiori alle aspettative, puoi adottare ulteriori passaggi per correggere il problema.

Per saperne di più sulla creazione di grafici personalizzati, consulta la documentazione di Cloud Monitoring.

Creare avvisi per le metriche di Spanner

Quando crei un'istanza Spanner, scegli la capacità di calcolo per l'istanza. Quando il carico di lavoro dell'istanza cambia, Spanner non regola automaticamente la capacità di calcolo dell'istanza. Di conseguenza, devi configurare diversi avvisi per assicurarti che l'istanza rimanga all'interno dei valori massimi consigliati per l'utilizzo della CPU e del limite consigliato per lo spazio di archiviazione.

I seguenti esempi mostrano come configurare i criteri di avviso per alcune metriche di Spanner. Per un elenco completo delle metriche disponibili, consulta l'elenco delle metriche per Spanner.

CPU ad alta priorità

Per creare un criterio di avviso che si attivi quando l'utilizzo della CPU ad alta priorità per Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Campo Nuova condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU per priorità.

(metric.type è spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
Tra serie temporali
Raggruppa serie temporali per
location per le istanze multiregionali;
lascia vuoto per le istanze regionali.
Tra serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
Trigger di avviso Any time series violates
Posizione soglia Above threshold
Valore soglia 45% per le istanze multiregione;
65% per le istanze regionali.
Finestra di ripetizione test 10 minutes

CPU media mobile su 24 ore

Per creare un criterio di avviso che si attiva quando la media mobile di 24 ore dell'utilizzo della CPU per Spanner è superiore a una soglia consigliata, utilizza le impostazioni riportate di seguito.

Campo Nuova condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU smussato.

(metric.type è spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Tra serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
Trigger di avviso Any time series violates
Posizione soglia Above threshold
Soglia 90%
Finestra di ripetizione test 10 minutes

Spazio di archiviazione

Per creare un criterio di avviso che si attivi quando lo spazio di archiviazione per la tua istanza Spanner supera una soglia consigliata, utilizza le seguenti impostazioni.

Campo Nuova condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Spazio di archiviazione utilizzato.

(metric.type è spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Tra serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua max
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
La condizione si attiva se Any time series violates
Posizione soglia Above threshold
Valore soglia Non è necessario impostare una soglia specifica per lo spazio di archiviazione massimo per nodo. Tuttavia, ti consigliamo di configurare un avviso quando raggiungi il limite massimo di spazio di archiviazione. Per scoprire di più, consulta Metriche di utilizzo dello spazio di archiviazione.
Finestra di ripetizione test 10 minutes

Passaggi successivi