Monitora le istanze con Cloud Monitoring

Questo documento descrive come utilizzare la console di Cloud Monitoring per monitorare le istanze Spanner.

La console di Cloud Monitoring fornisce diversi strumenti di monitoraggio per Spanner:

Se preferisci monitorare Spanner in modo programmatico, utilizza le librerie client di Cloud per Cloud Monitoring per recuperare le metriche.

Utilizza la dashboard selezionata di Cloud Monitoring

Cloud Monitoring offre una dashboard curata che riassume le informazioni chiave sulle tue istanze Spanner, tra cui:

  • Incidenti: avvisi di monitoraggio creati dall'utente che sono aperti, attivi o risolti
  • Eventi: un elenco di audit log di Spanner (se abilitati e disponibili)
  • Istanze: un riepilogo generale delle istanze Spanner, tra cui capacità di calcolo, conteggio dei database e integrità delle istanze
  • Grafici aggregati sulla velocità effettiva e sull'utilizzo dello spazio di archiviazione

Per visualizzare la dashboard di Spanner, segui questi passaggi:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è visualizzata la voce Risorse, seleziona Risorse e poi Cloud Spanner. In caso contrario, seleziona Dashboard, quindi la dashboard denominata Cloud Spanner.

Visualizza i dettagli dell'istanza e del database

Quando apri la dashboard organizzata per Spanner, vengono mostrati dati aggregati per tutte le tue istanze. Puoi visualizzare ulteriori dettagli su un'istanza specifica facendo clic sul nome dell'istanza in Istanze.

La dashboard mostra informazioni quali i metadati dell'istanza, i database nell'istanza e i grafici di varie metriche suddivise per regione.

Dalla pagina della dashboard dell'istanza, puoi anche visualizzare i grafici relativi a un database specifico nell'istanza:

  1. Sul lato destro, sopra i grafici delle metriche dell'istanza, fai clic su Metriche di database.

  2. Nell'elenco a discesa Seleziona un'analisi, seleziona il database da esaminare.

    La console di Cloud Monitoring visualizza i grafici per il database.

Creare grafici personalizzati per le metriche Spanner

Puoi usare Cloud Monitoring per creare grafici personalizzati per le metriche di Spanner. Puoi utilizzare Metrics Explorer per creare grafici temporanei ad hoc oppure creare grafici che vengono visualizzati in dashboard personalizzate.

In particolare, Cloud Monitoring consente di creare un grafico personalizzato che mostra se due o più metriche sono correlate tra loro. Ad esempio, puoi verificare la correlazione tra utilizzo della CPU e latenza in un'istanza Spanner, il che potrebbe indicare che l'istanza ha bisogno di una maggiore capacità di calcolo o che alcune query causano un elevato utilizzo della CPU.

Per iniziare a utilizzare questo esempio, segui questi passaggi:

  1. Nella console Google Cloud, seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione viene visualizzato Esplora metriche, selezionalo. Altrimenti, seleziona Risorse e poi Esplora metriche.

  3. Fai clic sulla scheda Opzioni di visualizzazione, poi seleziona la casella di controllo Scala logaritmica sull'asse Y. Questa opzione consente di confrontare più metriche quando una metrica ha valori molto più grandi delle altre.

  4. Nell'elenco a discesa sopra il riquadro a destra, seleziona A linee.

  5. Fai clic sulla scheda Metriche. Ora puoi aggiungere metriche al grafico.

Per aggiungere metriche di latenza al grafico:

  1. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/api/request_latencies, quindi fai clic sulla riga visualizzata sotto la casella.
  2. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  3. Nell'elenco a discesa Aggregatore, fai clic su max.
  4. (Facoltativo) Modifica il percentile di latenza:

    1. Fai clic su Mostra opzioni avanzate.
    2. Fai clic sull'elenco a discesa Allineatore, quindi fai clic sul percentile di latenza che vuoi visualizzare.

      Nella maggior parte dei casi, devi considerare la latenza del 50° percentile per capire la quantità tipica di latenza o la latenza del 99° percentile per capire la latenza dell'1% più lento delle richieste.

Per aggiungere metriche di utilizzo della CPU al grafico, segui questi passaggi:

  1. Fai clic su Aggiungi metrica.
  2. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/instance/cpu/utilization, poi fai clic sulla riga visualizzata sotto la casella.
  3. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  4. Nell'elenco a discesa Aggregatore, fai clic su max.

Ora hai un grafico che mostra le metriche di utilizzo e latenza della CPU per un'istanza di Spanner. Se entrambe le metriche sono superiori al previsto contemporaneamente, puoi completare ulteriori passaggi per risolvere il problema.

Per ulteriori informazioni sulla creazione di grafici personalizzati, consulta la documentazione di Cloud Monitoring.

Creare avvisi per le metriche Spanner

Quando crei un'istanza di Spanner, scegli la capacità di calcolo per l'istanza. Man mano che il carico di lavoro dell'istanza cambia, Spanner non regola automaticamente la capacità di calcolo dell'istanza. Di conseguenza, devi configurare diversi avvisi per assicurarti che l'istanza rimanga entro i limiti consigliati per l'utilizzo della CPU e il limite consigliato per lo spazio di archiviazione.

I seguenti esempi mostrano come configurare i criteri di avviso per alcune metriche Spanner. Per un elenco completo delle metriche disponibili, consulta Elenco delle metriche per Spanner.

CPU ad alta priorità

Per creare un criterio di avviso che si attiva quando l'utilizzo della CPU ad alta priorità per Spanner è superiore a una soglia consigliata, utilizza le impostazioni seguenti.

Nuovo campo condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU per priorità.

(Il tipo metric.type è spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
Nelle serie temporali
Raggruppa le serie temporali per
location per le istanze multiregionali;
lascia vuoto per le istanze a livello di regione.
In più serie temporali
Aggregazione di serie temporali
sum
Finestra scorrevole 10 m
Funzione finestra temporale continua mean
Campo Configura trigger avviso

Valore
Tipo di condizione Threshold
Trigger di avviso Any time series violates
Posizione soglia Above threshold
Valore soglia 45% per le istanze multiregionali;
65% per le istanze a livello di regione.
Finestra di nuovo test 10 minutes

Media mobile di 24 ore di CPU

Per creare un criterio di avviso che si attiva quando la media mobile di 24 ore dell'utilizzo della CPU per Spanner è superiore a una soglia consigliata, utilizza le impostazioni seguenti.

Nuovo campo condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo ottimizzato CPU.

(Il tipo metric.type è spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
In più serie temporali
Aggregazione di serie temporali
sum
Finestra scorrevole 10 m
Funzione finestra temporale continua mean
Campo Configura trigger avviso

Valore
Tipo di condizione Threshold
Trigger di avviso Any time series violates
Posizione soglia Above threshold
Soglia 90%
Finestra di nuovo test 10 minutes

Spazio di archiviazione

Per creare un criterio di avviso che si attiva quando lo spazio di archiviazione per la tua istanza Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Nuovo campo condizione

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Spazio di archiviazione utilizzato.

(Il tipo metric.type è spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
In più serie temporali
Aggregazione di serie temporali
sum
Finestra scorrevole 10 m
Funzione finestra temporale continua max
Campo Configura trigger avviso

Valore
Tipo di condizione Threshold
La condizione si attiva se Any time series violates
Posizione soglia Above threshold
Valore soglia Non è necessario impostare una soglia specifica per lo spazio di archiviazione massimo per nodo. Tuttavia, ti consigliamo di configurare un avviso per quando stai per raggiungere il limite massimo di spazio di archiviazione. Per scoprire di più, consulta Metriche di utilizzo dello spazio di archiviazione.
Finestra di nuovo test 10 minutes

Passaggi successivi