Monitora le istanze con Cloud Monitoring

Questo documento descrive come utilizzare la console di Cloud Monitoring per monitorare le istanze Spanner.

La console di Cloud Monitoring offre diversi strumenti di monitoraggio per Spanner:

Se preferisci monitorare Spanner in modo programmatico, utilizza le librerie client di Cloud per Cloud Monitoring per recuperare le metriche.

Utilizzare la dashboard selezionata di Cloud Monitoring

Cloud Monitoring offre una dashboard selezionata che riassume le informazioni chiave sulle istanze Spanner, tra cui:

  • Incidenti: avvisi di monitoraggio creati dall'utente che sono aperti, attivi o risolti
  • Eventi: un elenco di audit log di Spanner (se abilitati e disponibili)
  • Istanze: un riepilogo generale delle tue istanze Spanner, che include capacità di calcolo, conteggio dei database e integrità delle istanze
  • Grafici aggregati sulla velocità effettiva e sull'utilizzo dello spazio di archiviazione

Per visualizzare la dashboard di Spanner:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzata l'opzione Risorse, seleziona Risorse e poi Cloud Spanner. In alternativa, seleziona Dashboard e poi la dashboard denominata Cloud Spanner.

Visualizza i dettagli di istanza e database

Quando apri la dashboard selezionata per Spanner, vengono visualizzati dati aggregati per tutte le istanze. Puoi visualizzare ulteriori dettagli su un'istanza specifica facendo clic sul nome dell'istanza in Istanze.

La dashboard mostra informazioni come i metadati dell'istanza, i database nell'istanza e grafici di varie metriche suddivisi per regione.

Dalla pagina della dashboard dell'istanza, puoi anche visualizzare i grafici relativi a un database specifico nell'istanza:

  1. Sul lato destro, sopra i grafici delle metriche dell'istanza, fai clic su Metriche del database.

  2. Nell'elenco a discesa Seleziona un'analisi, seleziona il database che vuoi esaminare.

    La console di Cloud Monitoring mostra i grafici per il database.

Creare grafici personalizzati per le metriche Spanner

Puoi utilizzare Cloud Monitoring per creare grafici personalizzati per le metriche Spanner. Puoi utilizzare Metrics Explorer per creare grafici temporanei e ad hoc oppure creare grafici da visualizzare nelle dashboard personalizzate.

In particolare, Cloud Monitoring consente di creare un grafico personalizzato che mostra se due o più metriche sono correlate tra loro. Ad esempio, puoi verificare la correlazione tra utilizzo CPU e latenza in un'istanza Spanner, che potrebbe indicare che l'istanza ha bisogno di una maggiore capacità di calcolo o che alcune delle tue query causano un elevato utilizzo della CPU.

Per iniziare con questo esempio, segui questi passaggi:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzato Metrics Explorer, selezionalo. In caso contrario, seleziona Risorse e poi Metrics Explorer.

  3. Fai clic sulla scheda Opzioni di visualizzazione, quindi seleziona la casella di controllo Scala log sull'asse Y. Questa opzione ti consente di confrontare più metriche quando una metrica ha valori molto più grandi delle altre.

  4. Nell'elenco a discesa sopra il riquadro a destra, seleziona A linee.

  5. Fai clic sulla scheda Metriche. Ora puoi aggiungere metriche al grafico.

Per aggiungere metriche di latenza al grafico:

  1. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/api/request_latencies, quindi fai clic sulla riga visualizzata sotto la casella.
  2. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza da esaminare e fai clic su Applica.
  3. Nell'elenco a discesa Aggregatore, fai clic su max.
  4. (Facoltativo) Modifica il percentile di latenza:

    1. Fai clic su Mostra opzioni avanzate.
    2. Fai clic sull'elenco a discesa Allineatore, quindi fai clic sul percentile di latenza che vuoi visualizzare.

      Nella maggior parte dei casi, devi esaminare la latenza del 50° percentile, per comprendere la quantità tipica di latenza, o la latenza del 99° percentile, per comprendere la latenza per l'1% più lento delle richieste.

Per aggiungere metriche di utilizzo della CPU al grafico:

  1. Fai clic su Aggiungi metrica.
  2. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/instance/cpu/utilization, quindi fai clic sulla riga visualizzata sotto la casella.
  3. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza da esaminare e fai clic su Applica.
  4. Nell'elenco a discesa Aggregatore, fai clic su max.

Ora hai un grafico che mostra le metriche di latenza e utilizzo della CPU per un'istanza di Spanner. Se contemporaneamente entrambe le metriche superano il previsto, puoi svolgere ulteriori passaggi per risolvere il problema.

Per ulteriori informazioni sulla creazione di grafici personalizzati, consulta la documentazione di Cloud Monitoring.

Creare avvisi per le metriche di Spanner

Quando crei un'istanza di Spanner, scegli la capacità di calcolo per l'istanza. Al variare del carico di lavoro dell'istanza, Spanner non regola automaticamente la capacità di calcolo dell'istanza. Di conseguenza, devi configurare diversi avvisi per assicurarti che l'istanza rimanga entro i limiti massimi consigliati per l'utilizzo della CPU e il limite consigliato per lo spazio di archiviazione.

Gli esempi seguenti mostrano come configurare i criteri di avviso per alcune metriche Spanner. Per un elenco completo delle metriche disponibili, consulta l'elenco delle metriche per Spanner.

CPU ad alta priorità

Per creare un criterio di avviso che si attivi quando l'utilizzo della CPU ad alta priorità per Spanner supera una soglia consigliata, usa le seguenti impostazioni.

Campo Nuova condizione

Valore
Risorse e metriche Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU per priorità.

(Il valore metric.type è spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
In serie temporali
Raggruppa di serie temporali per
location per le istanze multiregionali;
lascia vuoto il campo per le istanze a livello di regione.
In tutte le serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Configura trigger di avviso
Campo

Valore
Tipo di condizione Threshold
Attivazione degli avvisi Any time series violates
Posizione soglia Above threshold
Valore soglia 45% per le istanze multiregionali;
65% per le istanze a livello di regione.
Periodo di nuovo test 10 minutes

Media mobile di 24 ore della CPU

Per creare un criterio di avviso che si attivi quando la media mobile di 24 ore dell'utilizzo della CPU per Spanner supera una soglia consigliata, utilizza le seguenti impostazioni.

Campo Nuova condizione

Valore
Risorse e metriche Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU ottimizzato.

(Il valore metric.type è spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
In tutte le serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Configura trigger di avviso
Campo

Valore
Tipo di condizione Threshold
Attivazione degli avvisi Any time series violates
Posizione soglia Above threshold
Soglia 90%
Periodo di nuovo test 10 minutes

Spazio di archiviazione

Per creare un criterio di avviso che si attivi quando lo spazio di archiviazione per l'istanza Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Campo Nuova condizione

Valore
Risorse e metriche Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Spazio di archiviazione utilizzato.

(Il valore metric.type è spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
In tutte le serie temporali
Aggregazione di serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua max
Configura trigger di avviso
Campo

Valore
Tipo di condizione Threshold
La condizione si attiva se Any time series violates
Posizione soglia Above threshold
Valore soglia Imposta la soglia sul 75% dello spazio di archiviazione massimo per nodo, moltiplicato per il numero di nodi. Per i limiti attuali dei nodi, consulta Quote e limiti di Spanner.
Periodo di nuovo test 10 minutes

Passaggi successivi