Monitoraggio con Cloud Monitoring

Questo documento descrive come utilizzare la console Cloud Monitoring per monitorare le istanze Cloud Spanner.

La console di Cloud Monitoring offre diversi strumenti di monitoraggio per Spanner:

Se preferisci monitorare Spanner in modo programmatico, utilizza le librerie client Cloud per Cloud Monitoring per recuperare le metriche.

Utilizzare la dashboard selezionata di Cloud Monitoring

Cloud Monitoring offre una dashboard selezionata che riepiloga le informazioni chiave sulle tue istanze Spanner, tra cui:

  • Incidenti: avvisi di monitoraggio creati dall'utente che sono aperti, attivi o risolti
  • Eventi: un elenco di log di controllo di Spanner (se attivati e disponibili)
  • Istanze: un riepilogo generale delle tue istanze Spanner, tra cui capacità di calcolo, conteggio dei database e integrità delle istanze
  • Grafici aggregati per l'utilizzo della velocità effettiva e dello spazio di archiviazione

Per visualizzare la dashboard di Spanner, segui questi passaggi:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzato Risorse, seleziona Risorse e poi Cloud Spanner. In alternativa, seleziona Dashboard e poi la dashboard denominata Cloud Spanner.

Visualizza dettagli istanza e database

Quando apri la dashboard selezionata per Spanner, vengono visualizzati i dati aggregati per tutte le istanze. Per visualizzare ulteriori dettagli su un'istanza specifica, fai clic sul nome dell'istanza in Istanze.

La dashboard visualizza informazioni come metadati di istanza, database nell'istanza e grafici di varie metriche suddivisi per regione.

Nella pagina della dashboard dell'istanza puoi anche visualizzare i grafici relativi a un database specifico nell'istanza:

  1. Sul lato destro, sopra i grafici delle metriche di istanza, fai clic su Metriche del database.

  2. Nell'elenco a discesa Seleziona un'analisi, scegli il database da esaminare.

    Nella console di Monitoring vengono visualizzati i grafici del database.

Creare grafici personalizzati per le metriche di Spanner

Puoi utilizzare Cloud Monitoring per creare grafici personalizzati per le metriche di Spanner. Puoi utilizzare Metrics Explorer per creare grafici temporanei e ad hoc oppure creare grafici da visualizzare nelle dashboard personalizzate.

In particolare, Cloud Monitoring consente di creare un grafico personalizzato che mostra se due o più metriche sono correlate tra loro. Ad esempio, puoi controllare una correlazione tra utilizzo della CPU e latenza in un'istanza Spanner, che potrebbe indicare che l'istanza ha bisogno di una maggiore capacità di calcolo o che alcune query stanno causando un elevato utilizzo della CPU.

Per iniziare con questo esempio:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzato Metrics Explorer, selezionalo. Altrimenti, seleziona Risorse e poi Metrics Explorer.

  3. Fai clic sulla scheda Visualizza opzioni, quindi seleziona la casella di controllo Scala nel log sull'asse Y. Questa opzione ti consente di confrontare più metriche quando una metrica ha valori molto più elevati rispetto alle altre.

  4. Nell'elenco a discesa sopra il riquadro a destra, seleziona A linee.

  5. Fai clic sulla scheda Metriche. Ora puoi aggiungere metriche al grafico.

Per aggiungere metriche di latenza al grafico:

  1. Nella casella Trova tipo di metrica e metrica, inserisci il valore spanner.googleapis.com/api/request_latencies, quindi fai clic sulla riga visualizzata sotto la casella.
  2. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza da esaminare e fai clic su Applica.
  3. Nell'elenco a discesa Aggregatore, fai clic su Max.
  4. Facoltativo: modifica il percentile di latenza:

    1. Fai clic su Mostra opzioni avanzate.
    2. Fai clic sull'elenco a discesa Allineatore, quindi fai clic sul percentile di latenza che vuoi visualizzare.

      Nella maggior parte dei casi, devi esaminare la latenza del 50° percentile, per comprendere la quantità tipica di latenza, o la latenza del 99° percentile, per comprendere la latenza per l'1% più lento delle richieste.

Per aggiungere metriche di utilizzo della CPU al grafico:

  1. Fai clic su Aggiungi metrica.
  2. Nella casella Trova metrica e tipo di risorsa, inserisci il valore spanner.googleapis.com/instance/cpu/utilization, poi fai clic sulla riga visualizzata sotto la casella.
  3. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza da esaminare e fai clic su Applica.
  4. Nell'elenco a discesa Aggregatore, fai clic su Max.

Ora hai un grafico che mostra le metriche di utilizzo e latenza della CPU per un'istanza Spanner. Se entrambe le metriche sono contemporaneamente più elevate del previsto, puoi eseguire ulteriori passaggi per correggere il problema.

Per ulteriori informazioni sulla creazione di grafici personalizzati, consulta la documentazione di Cloud Monitoring.

Crea avvisi per le metriche di Spanner

Quando crei un'istanza Spanner, scegli la capacità di calcolo dell'istanza. Man mano che il carico di lavoro dell'istanza cambia, Spannerer non regola automaticamente la capacità di calcolo dell'istanza. Di conseguenza, devi configurare diversi avvisi per assicurarti che l'istanza rispetti i limiti massimi di utilizzo della CPU e il limite consigliato per l'archiviazione.

Gli esempi seguenti mostrano come configurare i criteri di avviso per alcune metriche Spanner. Per un elenco completo delle metriche disponibili, consulta l'elenco delle metriche per Spanner.

CPU ad alta priorità

Per creare un criterio di avviso che si attivi quando l'utilizzo della CPU ad alta priorità per Cloud Spanner è superiore a una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo della CPU per priorità.

(metric.type è spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
In serie temporali
Raggruppa serie temporali per
location per le istanze a più aree geografiche;
lascia vuoto il campo per le istanze a livello di area geografica.
In tutte le serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Configura trigger di avvisi
Campo

Valore
Tipo di condizione Threshold
Trigger avviso Any time series violates
Posizione soglia Above threshold
Valore soglia 45% per istanze a più aree geografiche;
65% per istanze a livello di area geografica.
Rieseguire il test 10 minutes

Media mobile di CPU: 24 ore

Per creare un criterio di avviso che si attivi quando la media mobile di 24 ore dell'utilizzo della CPU per Cloud Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU ottimizzato.

(metric.type è spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
In tutte le serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Configura trigger di avvisi
Campo

Valore
Tipo di condizione Threshold
Trigger avviso Any time series violates
Posizione soglia Above threshold
Soglia 90%
Rieseguire il test 10 minutes

Spazio di archiviazione

Per creare un criterio di avviso che si attivi quando lo spazio di archiviazione per l'istanza Cloud Spanner è superiore a una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Spazio di archiviazione utilizzato.

(metric.type è spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
In tutte le serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua max
Configura trigger di avvisi
Campo

Valore
Tipo di condizione Threshold
La condizione si attiva se Any time series violates
Posizione soglia Above threshold
Valore soglia Imposta la soglia al 75% dello spazio di archiviazione massimo per nodo, moltiplicato per il numero di nodi. Per i limiti di nodi attuali, consulta Quote e limiti di Cloud Spanner.
Rieseguire il test 10 minutes

Passaggi successivi