Monitorar estados de réplica e status de replicação de disco para discos permanentes regionais


O Compute Engine mantém cópias de cada volume de disco permanente regional em duas zonas do Google Cloud. Cada cópia é chamada de réplica zonal. Quando você grava dados no disco, o Compute Engine os replica de maneira síncrona em ambas as réplicas para garantir alta disponibilidade (HA, na sigla em inglês). A qualquer momento, o status de replicação de disco do volume de Persistent Disk regional informa a capacidade de um disco gravar de maneira síncrona nas duas réplicas. O status de replicação do disco é determinado pelos estados de réplica das réplicas zonais do disco. O estado da réplica de uma zona informa o estado de uma réplica zonal individual em comparação com os dados mais recentes no disco. Se uma réplica zonal contiver os dados mais recentes do disco, ela será considerada sincronizada com os dados mais recentes do disco. Se as duas réplicas zonais estiverem sincronizadas, o volume do Persistent Disk regional será considerado totalmente replicado.

Neste documento, explicamos como monitorar os estados da réplica do disco permanente regional e o status da replicação do disco durante um período. Você pode usar esse documento para fazer o seguinte:

  1. Verifique os estados atuais e históricos das réplicas zonais do Persistent Disk regional.
  2. Use as informações sobre o estado da réplica de um momento específico para determinar se o disco foi totalmente replicado.

Para saber mais sobre o estado da réplica e o status de replicação do disco, consulte replicação de disco zonal para disco permanente regional.

Monitorar usando o console do Google Cloud

Nesta seção, explicamos como monitorar os estados da réplica e o status de replicação de disco de um volume de Persistent Disk regional usando o console do Google Cloud.

Verificar se as réplicas zonais estão sincronizadas para um único disco

Use o console do Google Cloud para verificar se as réplicas zonais de um volume específico do Persistent Disk regional estão sincronizadas com os dados mais recentes do disco.

Para informações detalhadas sobre os estados exatos das réplicas zonais de todos os volumes de Persistent Disk regionais em um projeto, verifique os estados da réplica zonal usando o painel do Cloud Monitoring.

Console

Para monitorar os estados da réplica zonal para seu volume regional do Persistent Disk, faça o seguinte:

  1. No console do Google Cloud, acesse a página Discos.

    Acessar "Discos"

  2. Na página Discos, na coluna Nome, selecione o disco para o qual você quer verificar os estados da réplica.

    A página Gerenciar disco é aberta para o disco selecionado e exibe a guia Detalhes desse disco.

  3. Na página Gerenciar disco, clique na guia Monitoramento.

    A página Gerenciar disco exibe as informações do Monitoring para o disco.

  4. Para ver as informações históricas do estado da réplica do seu disco, na guia Monitoramento, navegue até o gráfico Estado de replicação do disco permanente regional.

    O gráfico exibe os valores de estado da réplica para suas réplicas zonais durante a hora anterior na forma de duas linhas separadas do gráfico.

    O valor do estado da réplica pode ser um dos seguintes:

    • 0: a réplica não está sincronizada com os dados mais recentes do disco.
    • 1: A réplica é sincronizada com os dados mais recentes do disco.
  5. Para verificar o valor do estado da réplica para suas réplicas zonais em um momento específico, faça o seguinte:

    • Mantenha o ponteiro no gráfico para o valor de tempo em que você quer verificar o estado da réplica.
    • Para ver os valores de estado da réplica para suas réplicas zonais, navegue até a parte inferior do gráfico.
    • Opcional. Para ver o nome e o valor do estado da réplica indicados por uma linha do gráfico, mantenha o ponteiro sobre a linha do gráfico para qualquer valor de tempo específico. O gráfico destaca o nome e o estado específico de tempo da réplica em uma dica.
  6. Opcional. Para modificar o período em que você quer ver os dados do estado da réplica, selecione um período na parte superior da guia Monitoramento. As seguintes opções estão disponíveis:

    • 1 hour: a hora anterior. Esse é o valor padrão.
    • 6 horas: as 6 horas anteriores.
    • 1 dia: o dia anterior.
    • 1 semana: a semana anterior.
    • 1 mês: o mês anterior.
    • 6 semanas: as seis semanas anteriores.
    • Personalizado: é um período específico de sua escolha. Para especificar um período de monitoramento personalizado, clique em Personalizado e faça o seguinte:

      • No campo Data e hora de início, especifique o início do período de monitoramento. Você deve especificar um horário no passado.
      • No campo Data e hora de término, especifique o final do período de monitoramento. Você deve especificar um horário no passado.
      • Para salvar o período de monitoramento personalizado, clique em Aplicar.

Determinar se o disco está totalmente replicado

Depois de determinar se as réplicas zonais estão ou não sincronizadas com os dados mais recentes do disco, use essas informações para determinar se o disco está ou não totalmente replicado.

A qualquer momento, o disco era totalmente replicado se o valor do estado da réplica para as duas réplicas zonais fosse 1. Se esse não for o caso, verifique os estados de réplica exatos naquele momento para saber se o disco foi degradado ou atualizado. Para mais informações, consulte Monitorar estados de réplica zonais usando métricas do Cloud Monitoring.

Monitorar usando métricas do Cloud Monitoring

É possível verificar informações detalhadas sobre os estados exatos das réplicas zonais de todos os volumes de Persistent Disk regionais usando a métrica Regional disk replica state no Cloud Monitoring.

Sobre a métrica Regional disk replica state

É possível ver os estados atuais e históricos das réplicas de disco das suas réplicas zonais do Persistent Disk regional no painel do Cloud Monitoring. O Compute Engine captura os estados de réplica dos discos a cada minuto e os informa usando a métrica Regional disk replica state. No entanto, sempre que houver uma falha temporária na zona que afeta a VM à qual o volume do Persistent Disk regional está anexado, nenhum dado de métrica Regional disk replica state será exibido para nenhuma réplica zonal.

Veja a seguir todos os valores possíveis para a métrica Regional disk replica state. Suas réplicas regionais em discos permanentes estão sempre em um desses estados de réplicas de discos.

  • Synced: a réplica está disponível, recebe de maneira síncrona todas as gravações executadas no disco e está atualizada com todos os dados no disco.
  • CatchingUp: a réplica está disponível, mas ainda está acessando os dados da outra réplica no disco.
  • OutOfSync: a réplica está temporariamente indisponível e dessincronizada com os dados no disco.

Para informações sobre a definição de métrica, consulte a seção Métricas do Monitoring do Compute Engine.

É possível usar os dados da métrica Regional disk replica state para fazer o seguinte:

  • Determine o estado de replicação do seu disco permanente regional.
  • Analise o histórico do estado da réplica do volume regional do Persistent Disk para entender se a arquitetura de failover funciona conforme o esperado e tomar as medidas necessárias caso o estado do volume regional do Disco permanente mude.
  • Crie alertas com base nos dados das métricas Regional disk replica state, detecte mudanças nos estados regionais das réplicas do Persistent Disk e realize as ações necessárias. Para mais informações sobre como criar alertas com base em métricas, consulte Como adicionar uma política de alertas.

Verifique os dados da métrica Regional disk replica state

Para ver o status das réplicas zonais de um volume de Persistent Disk regional anexado, crie uma consulta e um gráfico temporário para a métrica Regional disk replica state. É possível fazer isso no Metrics Explorer usando a interface orientada por menu, a linguagem de consulta do Monitoring (MQL, na sigla em inglês) ou o PromQL.

  1. No painel de navegação do console do Google Cloud, selecione Monitoramento e  Metrics Explorer:

    Acesse o Metrics explorer

    A página do Metrics Explorer é aberta e exibe a guia Consultas.

  2. Para consultar os dados de estado de cada réplica zonal em um projeto, selecione os dados da série temporal para a métrica Regional disk replica state e remova o filtro de agregação fazendo o seguinte na barra de ferramentas do painel de consulta:

    1. Na função Métrica no menu, clique Selecione uma métrica e selecione Disquetes> Disco> Estado da réplica do disco regional de dois minutos.

    2. Clique em Aplicar.

    3. No menu Agregação, selecione Não agregado por nenhum.

    Um gráfico é exibido e exibe os dados de métricas da hora anterior para cada réplica como uma série temporal. Os dados das métricas são exibidos apenas para réplicas de volumes de discos permanentes regionais anexados.

    Para mais informações sobre como selecionar séries temporais para uma métrica, consulte Selecionar métricas ao usar o Metrics Explorer.

  3. Para mostrar simultaneamente as visualizações de gráfico e de tabela, na parte de cima do gráfico, clique em Ambos.

  4. Para ver os dados de todas as propriedades do Persistent Disk regionais disponíveis, na parte de cima da visualização da tabela, clique em Opções de exibição de colunas..., selecione todos os colunas e clicar em OK.

    O painel exibe os seguintes campos para cada linha na tabela, junto com os valores atuais:

    • disk_id: ID do disco.
    • zone: para volumes de Persistent Disk regionais, a região do disco.
    • replica_zone: zona de réplica
    • state: estado da réplica
    • storage_type: tipo de armazenamento do disco
    • value: valor do estado da réplica

    Para ver esses dados da série temporal correspondente na exibição do gráfico, mantenha o ponteiro no gráfico no horário atual. O gráfico exibe esses valores dentro de uma dica.

  5. Para verificar os estados históricos das réplicas de discos permanentes regionais em um momento específico, faça o seguinte:

    1. Mantenha o ponteiro do mouse sobre o gráfico em um horário específico da sua escolha. O painel exibe os dados de métricas de todos os estados de réplica de todas as réplicas zonais no seu projeto naquele momento específico.

      Na visualização do gráfico, essas informações aparecem dentro de uma dica.

      Na visualização em tabela, essas informações aparecem como linhas individuais.

    2. Observe os estados da réplica e os valores correspondentes. A qualquer momento, se um estado específico tivesse o valor 1, então a réplica ficava nesse estado.

      Na exibição do gráfico, verifique os estados e valores da réplica dentro da dica para os IDs de disco e zonas de réplica que você quer.

      Na visualização em tabela, verifique as colunas state e value para os IDs de disco específicos e as zonas de réplica que você quer.

    Para saber mais sobre o que significam os estados da réplica e os valores correspondentes, consulte Entenda os dados da métrica Regional disk replica state.

  6. Opcional: para visualizar as informações do estado da réplica de um rótulo específico, no menu Filtro, selecione aquele com os dados que você quer ver e conclua a caixa de diálogo. É possível adicionar vários filtros.

    O painel exibe os dados de métricas apenas para os rótulos filtrados. Para mais informações sobre filtros, consulte Filtrar dados com gráfico.

    Por exemplo, para visualizar os dados de estado da réplica de um volume específico de disco permanente regional, faça o seguinte:

    1. No menu Filtro, selecione o rótulo nome.
    2. No menu Comparador, selecione = (é igual a).
    3. No menu Valor, selecione o nome do disco que você quer.
  7. Opcional: para determinar a porcentagem de tempo em que as réplicas de um disco específico foram sincronizadas, filtre os dados do disco e do estado específicos e use o menu de agregação:

    1. No menu Filtro, selecione o rótulo nome.
    2. No menu Comparador, selecione = (é igual a).
    3. No menu Valor, selecione o nome do disco.
    4. No menu Filtro, selecione o rótulo estado.
    5. No menu Comparador, selecione = (é igual a).
    6. No menu Valor, selecione Sincronizado.
    7. No menu Agregação, selecione Média por réplica_zone.
    8. Selecione o período para o qual você quer ver os dados.

    O painel exibe os dados sobre o status synced médio das réplicas do disco durante o período especificado. Multiplique esses dados por 100 para determinar a porcentagem de tempo em que as réplicas foram sincronizadas. Se o valor do valor médio aparecer como 1 para esse período, a réplica estará sempre atualizada com os dados mais recentes. Um valor médio menor que 1 indica que a réplica não foi sincronizada em algum momento durante o período especificado.

    Para mais informações sobre agrupamento e alinhamento, consulte Escolher como exibir dados em gráficos.

  8. Opcional: para modificar o período em que você quer monitorar os dados de métricas, na parte superior do painel, clique em Última hora e selecione o período que você quer.

    É possível selecionar um período relativo à hora atual ou especificar os horários de início e término da sua escolha. Por padrão, você vê os dados de métricas da hora anterior.

MQL

  1. No painel de navegação do console do Google Cloud, selecione Monitoramento e  Metrics Explorer:

    Acesse o Metrics explorer

    A página do Metrics Explorer é aberta e exibe a guia Consultas.

  2. Na barra de ferramentas do painel de consulta, clique no botão com o nome que começa com < >.

  3. No campo Language, selecione MQL como o idioma da consulta. Esse campo está na mesma barra de ferramentas que permite formatar sua consulta.

  4. Opcional: desative o botão de alternância Execução automática.

  5. Digite sua consulta e clique em Executar consulta.

    Observação: quando a opção Execução automática está ativada, o botão Executar consulta não é exibido.

    Por exemplo, para visualizar os dados de estado da réplica para um disco chamado disk-1, execute a seguinte consulta:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-=1')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    

    Como outro exemplo, para determinar qual porcentagem de tempo as réplicas foram sincronizadas para um disco chamado disk-1, execute a seguinte consulta:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-1') && (metric.state == 'Synced')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    | group_by [metric.replica_zone],
        [value_replica_state_mean_mean: mean(value_replica_state_mean)]
    
  6. Para modificar o período em que você quer monitorar os dados da métrica, na parte superior do painel, clique em Última hora e selecione o período e o fuso horário desejados.

    É possível selecionar um período relativo à hora atual ou especificar os horários de início e término da sua escolha. Por padrão, você vê os dados de métricas da hora anterior.

PromQL

  1. No painel de navegação do console do Google Cloud, selecione Monitoramento e  Metrics Explorer:

    Acesse o Metrics explorer

    A página do Metrics Explorer é aberta e exibe a guia Consultas.

  2. Na barra de ferramentas do painel de consulta, clique no botão com o nome que começa com < >.

  3. No campo Language, selecione PromQL como o idioma da consulta. Esse campo está na mesma barra de ferramentas que permite formatar sua consulta.

  4. Opcional: desative o botão de alternância Execução automática.

  5. Digite sua consulta e clique em Executar consulta.

    Observação: quando a opção Execução automática está ativada, o botão Executar consulta não é exibido.

    Por exemplo, para visualizar os dados de estado da réplica para um disco chamado disk-1, execute a seguinte consulta:

    avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",metadata_system_name="disk-1"}[${__interval}])
    

    Como outro exemplo, para determinar qual porcentagem de tempo as réplicas foram sincronizadas para um disco chamado disk-1, execute a seguinte consulta:

    avg by (replica_zone)(avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",state="Synced",metadata_system_name="disk-1"}[${__interval}]))
    
  6. Para modificar o período em que você quer monitorar os dados da métrica, na parte superior do painel, clique em Última hora e selecione o período e o fuso horário desejados.

    É possível selecionar um período relativo à hora atual ou especificar os horários de início e término da sua escolha. Por padrão, você vê os dados de métricas da hora anterior.

Determinar os estados exatos da réplica zonal usando dados de métricas

Para entender os dados da métrica Regional disk replica state do volume regional do disco permanente, verifique as colunas de estado e valor das réplicas zonais no seu gráfico gerado. Se você não adicionar filtros à sua consulta, acontecerá o seguinte:

  • A coluna state mostra todos os estados de réplica de disco possíveis para uma réplica zonal, uma de Synced, CatchingUp e OutOfSync. O gráfico exibe cada um desses estados na forma de uma série temporal para todas as réplicas zonais de todos os discos permanentes regionais no seu projeto.
  • A coluna value indica se a réplica zonal está em um estado de réplica de disco específico ou não. Esta coluna mostra um valor binário correspondente (0 ou 1) para cada valor de estado em todas as réplicas zonais de todos os discos permanentes regionais em seu projeto.

Para qualquer réplica zonal de um disco permanente regional, se a coluna valor mostrar 1 para um estado de réplica de disco específico, essa réplica zonal estará nesse estado específico. Se a coluna value mostrar 0 para um estado específico, essa réplica não estará nesse estado. A qualquer momento, uma réplica zonal tem exatamente um dos estados da réplica de disco com 1 na coluna value. Os outros dois estados de réplica de disco têm 0 nas respectivas colunas value.

Para cada réplica zonal, o gráfico e a tabela exibem uma entrada separada para cada estado da réplica do disco: Synced, CatchingUp e OutOfSync. A coluna valor de cada entrada é um valor binário (0 ou 1) que indica se a réplica está ou não nesse estado. A qualquer momento, uma réplica zonal tem exatamente um estado de réplica com o valor 1.

Determinar o status exato de replicação de disco

É possível usar os estados de réplica das suas réplicas zonais para determinar o estado de replicação do volume do Persistent Disk regional da seguinte maneira:

  • Se as duas réplicas zonais tiverem 1 como o valor do estado Synced, o volume regional do disco permanente será totalmente replicado.
  • Se uma das réplicas zonais tiver 1 como o valor do estado Synced e a outra réplica zonal tiver 1 como o valor para o estado CatchingUp, então sua o volume regional do disco permanente está acompanhando.
  • Se uma das réplicas zonais tiver 1 como o valor do estado Synced e a outra réplica zonal tiver 1 como o valor para o estado OutOfSync, então seu volume regional do disco permanente é degradado.

Por exemplo, considere um my-disk1 de disco permanente regional que tem réplicas em us-central1-a e us-central1-b. Os cenários a seguir mostram os valores das colunas state e value para as réplicas zonais para cada estado de replicação possível de my-disk1:

Totalmente replicado

Nesse cenário, a réplica em us-central1-a e a réplica em us-central1-b são atualizadas com os dados mais recentes no disco. O gráfico exibe os seguintes valores para cada estado de réplica do disco para as réplicas zonais de my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 1
us-central1-b CatchingUp 0
us-central1-b OutOfSync 0

Atualizando

Nesse cenário, a réplica em us-central1-a é atualizada com os dados no disco, e a réplica em us-central1-b está alcançando os dados no disco. O gráfico exibe os seguintes valores para cada estado de réplica de disco das réplicas zonais de my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 1
us-central1-b OutOfSync 0

Degradado

Nesse cenário, a réplica em us-central1-a é atualizada com os dados no disco e a réplica em us-central1-b está dessincronizada. O gráfico exibe os seguintes valores para cada estado de réplica do disco para as réplicas zonais de my-disk1:

replica_zone state value
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 0
us-central1-b OutOfSync 1

A seguir