Monitoraggio con Cloud Monitoring

Questo documento descrive come utilizzare la console di Cloud Monitoring per monitorare le tue istanze Cloud Spanner.

La console di Cloud Monitoring offre diversi strumenti di monitoraggio per Spanner:

Se preferisci monitorare Spanner in modo programmatico, utilizza le librerie client Cloud per Cloud Monitoring per recuperare le metriche.

Utilizzo della dashboard selezionata di Cloud Monitoring

Cloud Monitoring offre una dashboard selezionata che riepiloga le informazioni chiave sulle istanze Spanner, tra cui:

  • Incidenti: avvisi di monitoraggio creati dall'utente che sono aperti, attivi o risolti.
  • Eventi: un elenco di log di controllo Spanner (se attivati e disponibili)
  • Istanze: un riepilogo generale delle tue istanze Spanner, tra cui funzionalità di calcolo, conteggio dei database e integrità delle istanze
  • Grafici aggregati relativi a velocità effettiva e utilizzo dello spazio di archiviazione

Per visualizzare la dashboard di Spanner:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il seguente pulsante:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzato Risorse, seleziona Risorse, quindi seleziona Cloud Spanner. In caso contrario, seleziona Dashboard e poi la dashboard denominata Cloud Spanner.

Visualizzazione di dettagli di istanze e database

La dashboard selezionata per Spanner mostra i dati aggregati di tutte le tue istanze. Per visualizzare ulteriori dettagli su un'istanza specifica, fai clic sul nome dell'istanza in Istanze.

La dashboard visualizza informazioni come metadati di istanza, database nell'istanza e grafici di varie metriche suddivisi per area geografica.

Nella pagina della dashboard dell'istanza puoi anche visualizzare i grafici di un database specifico nell'istanza:

  1. A destra, sopra i grafici delle metriche dell'istanza, fai clic su Metriche del database.

  2. Nell'elenco a discesa Seleziona un'analisi, seleziona il database da esaminare.

    La console di Monitoring mostra i grafici relativi al database.

Creazione di grafici personalizzati per le metriche Spanner

Puoi utilizzare Cloud Monitoring per creare grafici personalizzati per le metriche Spanner. Puoi utilizzare Metrics Explorer per creare grafici temporanei e ad hoc oppure creare grafici che vengono visualizzati nelle dashboard personalizzate.

In particolare, Cloud Monitoring consente di creare un grafico personalizzato che mostra se due o più metriche sono correlate tra loro. Ad esempio, puoi verificare una correlazione tra l'utilizzo della CPU e la latenza in un'istanza Spanner, il che potrebbe indicare che l'istanza richiede più capacità di calcolo o che alcune delle tue query causano un elevato utilizzo della CPU.

Per iniziare con questo esempio:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il seguente pulsante:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzato Metrics Explorer, selezionalo. In alternativa, seleziona Risorse e poi Metrics Explorer.

  3. Fai clic sulla scheda Opzioni di visualizzazione, quindi seleziona la casella di controllo Scala log in asse Y. Questa opzione ti consente di confrontare più metriche quando una metrica ha valori molto più elevati delle altre.

  4. Nell'elenco a discesa sopra il riquadro a destra, seleziona Riga.

  5. Fai clic sulla scheda Metriche. Ora puoi aggiungere metriche al grafico.

Per aggiungere metriche di latenza al grafico:

  1. Nella casella Trova tipo di risorsa e Metrica, inserisci il valore spanner.googleapis.com/api/request_latencies, quindi fai clic sulla riga visualizzata sotto la casella.
  2. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  3. Nell'elenco a discesa Aggregatore, fai clic su max.
  4. (Facoltativo) Modifica il percentile di latenza:

    1. Fai clic su Mostra opzioni avanzate.
    2. Fai clic sull'elenco a discesa Allineatore, quindi sul percentile che vuoi visualizzare.

      Nella maggior parte dei casi, dovresti esaminare la latenza del 50° percentile, per comprendere la latenza tipica o la latenza del 99° percentile, per comprendere la latenza per l'1% più lento delle richieste.

Per aggiungere metriche di utilizzo della CPU al grafico, segui questi passaggi:

  1. Fai clic su Aggiungi metrica.
  2. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/instance/cpu/utilization, quindi fai clic sulla riga che viene visualizzata sotto la casella.
  3. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  4. Nell'elenco a discesa Aggregatore, fai clic su max.

Ora hai un grafico che mostra le metriche di utilizzo e latenza della CPU per un'istanza di Spark. Se entrambe le metriche sono più alte del previsto contemporaneamente, puoi eseguire ulteriori passaggi per risolvere il problema.

Per ulteriori informazioni sulla creazione di grafici personalizzati, consulta la documentazione di Cloud Monitoring.

Creazione di avvisi per le metriche Spanner

Quando crei un'istanza Spanner, scegli la funzionalità di calcolo dell'istanza. Al variare del carico di lavoro dell'istanza, Spanner non regola automaticamente la capacità di calcolo dell'istanza. Di conseguenza, devi configurare diversi avvisi per assicurarti che l'istanza rimanga nei limiti massimi di utilizzo della CPU e nei limiti consigliati per l'archiviazione.

Gli esempi seguenti mostrano come configurare i criteri di avviso per alcune metriche Spanner. Per un elenco completo delle metriche disponibili, consulta l'elenco delle metriche per Spanner.

CPU CPU ad alta priorità

Per creare un criterio di avviso che si attivi quando l'utilizzo della CPU ad alta priorità per Cloud Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU per priorità.

(nome metrica.tipo è spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
In tutte le serie temporali
Raggruppa serie temporali per
location per istanze a più aree geografiche;
lascia vuoto il campo per le istanze a livello di regione.
In tutte le serie temporali
Aggregazione delle serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Configura trigger di avviso
Campo

Valore
Tipo di condizione Threshold
Attivazione avvisi Any time series violates
Posizione soglia Above threshold
Valore soglia 45% per le istanze a più aree geografiche;
65% per le istanze a livello di regione.
Esegui di nuovo il test della finestra 10 minutes

CPU media mobile di 24 ore

Per creare un criterio di avviso che si attivi quando la media mobile di 24 ore dell'utilizzo della CPU per Cloud Spanner è superiore a una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU ottimizzato.

(nome metrica.tipo è spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
In tutte le serie temporali
Aggregazione delle serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Configura trigger di avviso
Campo

Valore
Tipo di condizione Threshold
Attivazione avvisi Any time series violates
Posizione soglia Above threshold
Soglia 90%
Esegui di nuovo il test della finestra 10 minutes

Spazio di archiviazione

Per creare un criterio di avviso che si attivi quando lo spazio di archiviazione per l'istanza Cloud Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Cloud Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Spazio di archiviazione utilizzato.

(nome metrica.tipo è spanner.googleapis.com/instance/storage/used_bytes).
Filtro instance_id = YOUR_INSTANCE_ID
In tutte le serie temporali
Aggregazione delle serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua max
Configura trigger di avviso
Campo

Valore
Tipo di condizione Threshold
La condizione si attiva se Any time series violates
Posizione soglia Above threshold
Valore soglia Imposta la soglia sul 75% dello spazio di archiviazione massimo per nodo, moltiplicato per il numero di nodi. Per i limiti di nodi correnti, consulta Quote e limiti di Cloud Spanner.
Esegui di nuovo il test della finestra 10 minutes

Passaggi successivi