Monitora gli stati delle repliche e lo stato di replica per i dischi regionali


Compute Engine gestisce copie di ogni disco regionale in due zone Google Cloud . Ogni copia è chiamata replica a livello di zona. Quando scrivi dati sul disco, Compute Engine li replica in modo sincrono su entrambe le repliche per garantire un'alta disponibilità (HA). In qualsiasi momento, lo stato della replica del disco del disco regionale indica la capacità di un disco di scrivere in modo sincrono in entrambe le repliche. Lo stato di replica del disco è determinato dagli stati di replica delle repliche zonali del disco. Lo stato della replica per una zona indica lo stato di una singola replica a livello di zona rispetto agli ultimi dati sul disco. Se una replica a livello di zona contiene i dati più recenti del disco, viene considerata sincronizzata con i dati più recenti del disco. Se entrambe le repliche a livello di zona sono sincronizzate, ildisco permanente regionale o ildisco Hyperdisk ad alta disponibilità bilanciata è considerato completamente replicato.

Questo documento spiega come monitorare gli stati di replica dei dischi regionali e il relativo stato di replica nel tempo. Puoi utilizzare questo documento per:

  1. Controlla gli stati di replica attuali e storici dei tuoi dischi regionali.
  2. Utilizza le informazioni sullo stato della replica di un momento specifico per determinare se il disco è stato completamente replicato.

Per saperne di più sullo stato della replica e sullo stato della replica dei dischi, consulta Informazioni sulla replica dei dischi sincrona.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per visualizzare gli stati di replica utilizzando Cloud Monitoring, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Monitoraggio utilizzando la console Google Cloud

Questa sezione spiega come monitorare gli stati delle repliche e lo stato della replica del disco di un volume Hyperdisk bilanciato ad alta disponibilità o di un volume con disco persistente regionaleutilizzando la console Google Cloud .

Verificare se le repliche a livello di zona sono sincronizzate per un singolo disco

Puoi utilizzare la console Google Cloud per verificare se le repliche zonali di un disco regionale sono sincronizzate con i dati più recenti del disco.

Per visualizzare informazioni dettagliate sugli stati esatti delle repliche zonali per tutti i dischi regionali di un progetto, controlla gli stati delle repliche zonali utilizzando la dashboard di Cloud Monitoring.

Console

Per monitorare gli stati delle repliche zonali per i dischi regionali, procedi nel seguente modo:

  1. Nella console Google Cloud , vai alla pagina Dischi.

    Vai a Dischi

  2. Nella pagina Dischi, nella colonna Nome, seleziona il disco per cui vuoi controllare gli stati delle repliche.

    Si apre la pagina Gestisci disco per il disco selezionato e viene visualizzata la scheda Dettagli relativa al disco.

  3. Fai clic sulla scheda Osservabilità.

    La pagina Gestisci disco mostra le informazioni di monitoraggio del disco.

  4. Per visualizzare le informazioni sullo stato storico della replica del disco, nella scheda Osservabilità, vai al grafico Stato di replica del disco permanente regionale.

    Il grafico mostra i valori dello stato delle repliche a livello di zona nell'ora precedente sotto forma di due linee del grafico separate.

    Il valore dello stato della replica può essere uno dei seguenti:

    • 0: la replica non è sincronizzata con i dati più recenti del disco.
    • 1. La replica viene sincronizzata con i dati più recenti del disco.
  5. Per controllare il valore dello stato della replica per le repliche zonali in un determinato momento, procedi nel seguente modo:

    • Tieni premuto il cursore sul grafico per il valore del tempo in cui vuoi controllare lo stato della replica.
    • Per visualizzare i valori dello stato delle repliche zonali, vai alla parte inferiore del grafico.
    • (Facoltativo) Per visualizzare il nome e il valore dello stato della replica indicato da una linea del grafico, tieni premuto il cursore sopra la linea del grafico per un valore temporale specifico. Il grafico evidenzia il nome e lo stato specifico della replica in una descrizione comando.
  6. (Facoltativo) Per modificare il periodo di tempo per il quale vuoi visualizzare i dati relativi allo stato della replica, seleziona un periodo di tempo nella parte superiore della scheda Osservabilità. Sono disponibili le seguenti opzioni:

    • 1 ora: l'ora precedente. Questo è il valore predefinito.
    • 6 ore: le 6 ore precedenti.
    • 1 giorno: il giorno precedente.
    • 1 settimana: la settimana precedente.
    • 1 mese: il mese precedente.
    • 6 settimane: le 6 settimane precedenti.
    • Personalizzato: un periodo di tempo specifico a tua scelta. Per specificare un periodo di monitoraggio personalizzato, fai clic su Personalizzato e poi procedi nel seguente modo:

      • Nel campo Data e ora di inizio, specifica l'inizio del periodo di monitoraggio. Devi specificare un'ora passata.
      • Nel campo Data e ora di fine, specifica la fine del periodo di monitoraggio. Devi specificare un'ora passata.
      • Per salvare il periodo di tempo di monitoraggio personalizzato, fai clic su Applica.

Determinare se il disco è completamente replicato

Dopo aver stabilito se le repliche zonali sono sincronizzate con i dati più recenti del disco, puoi utilizzare queste informazioni per determinare se il disco è completamente replicato.

In qualsiasi momento, il disco era completamente replicato se il valore dello stato della replica per entrambe le repliche a livello di zona era 1. In caso contrario, controlla gli stati esatti delle repliche in quel momento per sapere se il disco era in degrado o in aggiornamento. Per ulteriori informazioni, consulta Monitorare l'utilizzo delle metriche di Cloud Monitoring.

Monitoraggio tramite le metriche di Cloud Monitoring

Puoi controllare informazioni dettagliate sugli stati esatti delle repliche zonali per tutti i tuoi dischi regionali utilizzando la metrica Regional disk replica state in Cloud Monitoring.

Informazioni sulla metrica Regional disk replica state

Puoi visualizzare gli stati attuali e storici delle repliche dei dischi delle tue repliche zonali nella dashboard di Cloud Monitoring. Compute Engine acquisisce gli stati delle repliche dei dischi ogni minuto e li registra utilizzando la metrica Regional disk replica state. Tuttavia, se si verifica un'interruzione di servizio zonale che interessa l'istanza di calcolo a cui è collegata una replica zonale, non vedrai alcun dato metrico Regional disk replica state per nessuna delle due repliche zonali.

Di seguito sono riportati i valori possibili della metrica Regional disk replica state. Le repliche zonali sono sempre in uno di questi stati delle repliche dei dischi.

  • Synced: la replica è disponibile, riceve in modo sincrono tutte le scritture eseguite sul disco ed è aggiornata con tutti i dati sul disco.
  • CatchingUp: la replica è disponibile, ma sta ancora recuperando i dati sul disco dell'altra replica.
  • OutOfSync: la replica non è temporaneamente disponibile e non è sincronizzata con i dati sul disco.

Per informazioni sulla definizione della metrica, consulta la sezione Metriche di monitoraggio di Compute Engine.

Puoi utilizzare i dati delle metriche Regional disk replica state per:

  • Determina lo stato della replica del disco a livello di regione.
  • Esamina la cronologia dello stato della replica del tuo disco regionale per capire se l'architettura di failover funziona come previsto e prendi le misure necessarie in caso di variazione dello stato del disco regionale.
  • Crea avvisi in base ai dati delle metriche Regional disk replica state, rileva eventuali modifiche agli stati delle repliche e intraprendi le azioni necessarie. Per ulteriori informazioni su come creare avvisi basati su metriche, consulta Come aggiungere un criterio di avviso.

Controlla i dati della metrica Regional disk replica state

Per visualizzare lo stato delle repliche zonali di un disco regionale collegato, crea una query e un grafico temporaneo per la metrica Regional disk replica state. Puoi farlo in Metrics Explorer utilizzando l'interfaccia basata su menu, Monitoring Query Language (MQL) o PromQL.

  1. Nella console Google Cloud , vai alla pagina  Esplora metriche:

    Vai a Esplora metriche

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.

    Viene visualizzata la pagina Esplora metriche con la scheda Query.

  2. Per visualizzare i dati relativi allo stato delle repliche per ogni replica zonale in un progetto, seleziona i dati delle serie temporali per la metrica Regional disk replica state e poi rimuovi il filtro di aggregazione seguendo questa procedura nella barra degli strumenti del riquadro delle query:

    1. Nel menu Metrica, fai clic su Seleziona una metrica e poi seleziona Disco > Disco > Stato replica del disco regionale.

    2. Fai clic su Applica.

    3. Nel menu Aggregazione, seleziona Non aggregato per Nessuno.

    Viene visualizzato un grafico che mostra i dati delle metriche dell'ora precedente per ogni replica come serie temporali. Vengono visualizzati i dati delle metriche solo per le repliche zonali dei dischi collegati.

    Per ulteriori informazioni sulla selezione delle serie temporali per una metrica, consulta Selezionare le metriche durante l'utilizzo di Metrics Explorer.

  3. Per visualizzare contemporaneamente le visualizzazioni del grafico e della tabella, fai clic su Entrambe nella parte superiore del grafico.

  4. Per visualizzare i dati di tutte le proprietà dei dischi regionali disponibili, nella parte superiore della visualizzazione tabella, fai clic su Opzioni di visualizzazione delle colonne, seleziona tutte le colonne e poi fai clic su Ok.

    La dashboard mostra i seguenti campi per ogni riga della tabella, insieme ai relativi valori correnti:

    • disk_id: ID del disco
    • zone: la regione in cui è stato creato il disco regionale.
    • replica_zone: zona di replica
    • state: stato della replica
    • storage_type: tipo di archiviazione del disco
    • value: valore per lo stato della replica

    Per visualizzare questi dati nella serie temporale corrispondente nella visualizzazione del grafico, tieni premuto il cursore sul grafico nell'ora corrente. Il grafico visualizza questi valori in una descrizione comando.

  5. Per controllare gli stati delle repliche storiche in un momento specifico, procedi nel seguente modo:

    1. Tieni il cursore sopra il grafico in corrispondenza di un valore temporale specifico scelto da te. La dashboard mostra i dati delle metriche per tutti gli stati delle repliche di tutte le repliche zonali nel tuo progetto in quel determinato momento.

      Nella visualizzazione del grafico, queste informazioni vengono visualizzate in una descrizione comando.

      Nella visualizzazione tabella, queste informazioni vengono visualizzate come righe singole.

    2. Prendi nota degli stati delle repliche e dei relativi valori. In un determinato momento, se un determinato stato ha un valore 1, la replica era in quello stato.

      Nella visualizzazione del grafico, controlla gli stati e i valori delle repliche all'interno della descrizione comando per gli ID disco e le zone di replica che ti interessano.

      Nella visualizzazione tabella, controlla le colonne state e value per gli ID disco e le zone di replica specifici che ti interessano.

    Per scoprire di più sul significato degli stati della replica e dei relativi valori, consulta Informazioni sui dati delle metriche Regional disk replica state.

  6. (Facoltativo) Per visualizzare le informazioni sullo stato della replica per un'etichetta specifica, nel menu Filtra seleziona l'etichetta per cui vuoi visualizzare i dati e poi completa la finestra di dialogo. Puoi aggiungere più filtri.

    La dashboard mostra i dati delle metriche solo per le etichette filtrate. Per saperne di più sui filtri, consulta Filtrare i dati dei grafici.

    Ad esempio, per visualizzare i dati relativi allo stato della replica per un disco specifico:

    1. Nel menu Filtro, seleziona l'etichetta nome.
    2. Nel menu Comparatore, seleziona = (uguale a).
    3. Nel menu Valore, seleziona il nome del disco che preferisci.
  7. (Facoltativo) Per determinare la percentuale di volte in cui le repliche di un determinato disco sono state sincronizzate, filtra i dati per il disco e lo stato specifici, quindi utilizza il menu di aggregazione:

    1. Nel menu Filtro, seleziona l'etichetta nome.
    2. Nel menu Comparatore, seleziona = (uguale a).
    3. Nel menu Valore, seleziona il nome del disco.
    4. Nel menu Filtro, seleziona l'etichetta stato.
    5. Nel menu Comparatore, seleziona = (uguale a).
    6. Nel menu Valore, seleziona Sincronizzato.
    7. Nel menu Aggregazione, seleziona Media per replica_zone.
    8. Seleziona il periodo di tempo per il quale vuoi visualizzare i dati.

    La dashboard mostra i dati relativi allo stato medio synced delle repliche del tuo disco nel periodo di tempo specificato. Moltiplica questi dati per 100 per determinare la percentuale di tempo per cui le repliche sono state sincronizzate. Se il valore del valore medio è 1 per quel periodo di tempo, la replica è sempre stata aggiornata con i dati più recenti. Un valore medio inferiore a 1 indica che la replica non è stata sincronizzata in un determinato momento durante il periodo di tempo specificato.

    Per ulteriori informazioni su raggruppamento e allineamento, consulta Scegliere come visualizzare i dati dei grafici.

  8. (Facoltativo) Per modificare il periodo di tempo in cui vuoi monitorare i dati metrici, fai clic su Ultima ora nella parte superiore della dashboard e seleziona il periodo di tempo che ti interessa.

    Puoi selezionare un periodo di tempo relativo all'ora corrente o specificare le ore di inizio e di fine che preferisci. Per impostazione predefinita, vengono visualizzati i dati delle metriche per l'ora precedente.

MQL

  1. Nella console Google Cloud , vai alla pagina  Esplora metriche:

    Vai a Esplora metriche

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.

    Viene visualizzata la pagina Esplora metriche con la scheda Query.

  2. Nella barra degli strumenti del riquadro delle query, fai clic sul pulsante il cui nome inizia con < >.

  3. Nel campo Lingua, seleziona MQL come lingua delle query. Questo campo si trova nella stessa barra degli strumenti che ti consente di formattare la query.

  4. (Facoltativo) Disattiva l'opzione di attivazione/disattivazione Esecuzione automatica.

  5. Inserisci la query e fai clic su Esegui query.

    Quando l'opzione di attivazione/disattivazione Esecuzione automatica è attivata, il pulsante Esegui query non viene visualizzato.

    Ad esempio, per visualizzare i dati dello stato della replica per un disco denominato disk-1, esegui la seguente query:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-=1')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    

    Come altro esempio, per determinare la percentuale di volte in cui le repliche sono state sincronizzate per un disco denominato disk-1, esegui la seguente query:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-1') && (metric.state == 'Synced')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    | group_by [metric.replica_zone],
        [value_replica_state_mean_mean: mean(value_replica_state_mean)]
    
  6. Per modificare il periodo di tempo in cui vuoi monitorare i dati delle metriche, nella parte superiore della dashboard fai clic su Ultima ora e seleziona il periodo di tempo e il fuso orario che preferisci.

    Puoi selezionare un periodo di tempo relativo all'ora corrente o specificare le ore di inizio e di fine che preferisci. Per impostazione predefinita, vengono visualizzati i dati delle metriche per l'ora precedente.

PromQL

  1. Nella console Google Cloud , vai alla pagina  Esplora metriche:

    Vai a Esplora metriche

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.

    Viene visualizzata la pagina Esplora metriche con la scheda Query.

  2. Nella barra degli strumenti del riquadro delle query, fai clic sul pulsante il cui nome inizia con < >.

  3. Nel campo Lingua, seleziona PromQL come linguaggio delle query. Questo campo si trova nella stessa barra degli strumenti che ti consente di formattare la query.

  4. (Facoltativo) Disattiva l'opzione di attivazione/disattivazione Esecuzione automatica.

  5. Inserisci la query e fai clic su Esegui query.

    Quando l'opzione di attivazione/disattivazione Esecuzione automatica è attivata, il pulsante Esegui query non viene visualizzato.

    Ad esempio, per visualizzare i dati dello stato della replica per un disco denominato disk-1, esegui la seguente query:

    avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",metadata_system_name="disk-1"}[${__interval}])
    

    Come altro esempio, per determinare la percentuale di volte in cui le repliche sono state sincronizzate per un disco denominato disk-1, esegui la seguente query:

    avg by (replica_zone)(avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",state="Synced",metadata_system_name="disk-1"}[${__interval}]))
    
  6. Per modificare il periodo di tempo in cui vuoi monitorare i dati delle metriche, nella parte superiore della dashboard fai clic su Ultima ora e seleziona il periodo di tempo e il fuso orario che preferisci.

    Puoi selezionare un periodo di tempo relativo all'ora corrente o specificare le ore di inizio e di fine che preferisci. Per impostazione predefinita, vengono visualizzati i dati delle metriche per l'ora precedente.

Determinare gli stati esatti delle repliche zonali utilizzando i dati delle metriche

Per comprendere i dati della metrica Regional disk replica state per un disco regionale, devi controllare le colonne state e value per le repliche zonali nel grafico generato. Se non aggiungi filtri alla query, si verificano le seguenti situazioni:

  • La colonna state mostra tutti i possibili stati della replica del disco per una replica a livello di zona, uno dei valori Synced, CatchingUp e OutOfSync. Il grafico mostra ciascuno di questi stati sotto forma di serie temporali per tutte le repliche zonali di tutti i dischi regionali del progetto.
  • La colonna value indica se la replica zonale è o meno in uno stato specifico della replica del disco. Questa colonna mostra un valore binario corrispondente (0 o 1) per ogni valore di state per tutte le repliche zonali di tutti i dischi regionali del progetto.

Per qualsiasi replica zonale, se la colonna value mostra 1 per uno stato specifico della replica del disco, la replica zonale è in quel determinato stato. Se la colonna value mostra 0 per uno stato specifico, significa che la replica non è in quello stato specifico. In un determinato momento, una replica a livello di zona ha esattamente uno degli stati di replica del disco con 1 nella colonna value. Gli altri due stati della replica del disco hanno 0 nelle rispettive colonne value.

Per ogni replica zonale, il grafico e la tabella mostrano una voce distinta per ogni stato della replica del disco: Synced, CatchingUp e OutOfSync. La colonna value per ogni voce è un valore binario (0 o 1) che indica se la replica è in quel determinato stato. In un determinato momento, una replica zonale ha esattamente uno stato di replica con valore 1.

Determinare lo stato esatto della replica del disco

Puoi utilizzare gli stati delle repliche zonali per determinare lo stato di replica dei dischi a livello di regione nel seguente modo:

  • Se entrambe le repliche a livello di zona hanno 1 come valore per lo stato Synced, il disco è completamente replicato.
  • Se una delle repliche zonali ha 1 come valore per lo stato Synced e l'altra replica zonale ha 1 come valore per lo stato CatchingUp, il disco è in fase di aggiornamento.
  • Se una delle repliche zonali ha 1 come valore per lo stato Synced e l'altra replica zonale ha 1 come valore per lo stato OutOfSync, il disco è in stato di degrado.

Ad esempio, considera un disco denominato my-disk1 con repliche in us-central1-a e us-central1-b. I seguenti scenari mostrano i valori delle colonne state e value per le repliche zonali per ogni possibile stato di replica di my-disk1:

Completamente replicato

In questo scenario, la replica in us-central1-a e la replica in us-central1-b vengono entrambe aggiornate con i dati più recenti sul disco. Il grafico visualizza i seguenti valori per ogni stato della replica del disco per le repliche zonali di my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 1
us-central1-b CatchingUp 0
us-central1-b OutOfSync 0

Aggiornamento

In questo scenario, la replica in us-central1-a viene aggiornata con i dati sul disco e la replica in us-central1-b sta raggiungendo i dati sul disco. Il grafico mostra i seguenti valori per ogni stato della replica del disco per le repliche zonali di my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 1
us-central1-b OutOfSync 0

Compromesso

In questo scenario, la replica in us-central1-a viene aggiornata con i dati sul disco e la replica in us-central1-b non è sincronizzata. Il grafico visualizza i seguenti valori per ogni stato della replica del disco per le repliche zonali di my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 0
us-central1-b OutOfSync 1

Passaggi successivi