O Compute Engine mantém cópias de cada disco regional em duas zonas Google Cloud . Cada cópia é chamada de réplica zonal. Quando você grava dados no disco, o Compute Engine os replica de maneira síncrona em ambas as réplicas para garantir alta disponibilidade (HA). A qualquer momento, o status de replicação de disco do disco regional informa a capacidade de um disco gravar de maneira síncrona nas duas réplicas. O status de replicação do disco é determinado pelos estados de réplica das réplicas zonais do disco. O estado da réplica de uma zona informa o estado de uma réplica zonal individual em comparação com os dados mais recentes no disco. Se uma réplica zonal contiver os dados mais recentes do disco, ela será considerada sincronizada com os dados mais recentes do disco. Se as duas réplicas zonais estiverem sincronizadas, o Persistent Disk regional ou o Hyperdisk Balanced High Availability será considerado totalmente replicado.
Neste documento, explicamos como monitorar os estados da réplica dos discos regionais e o status da replicação de disco durante um período de tempo. Você pode usar este documento para:
- Verifique os estados atuais e históricos das réplicas dos discos regionais.
- Para verificar apenas se as réplicas zonais de um disco regional específico estão sincronizadas ou não, monitore usando o console do Google Cloud.
- Para verificar o estado exato da réplica zonal para ver se há réplicas de todos os discos em um projeto, monitore usando o painel do Cloud Monitoring.
- Use as informações sobre o estado da réplica de um momento específico para determinar se o disco foi totalmente replicado.
Para saber mais sobre o estado da réplica e o status de replicação do disco, consulte Sobre a replicação síncrona de discos.
Funções exigidas
Para receber as permissões necessárias para conferir os estados de replicação usando o Cloud Monitoring, peça ao administrador para conceder a você os seguintes papéis do IAM:
-
Para conferir as métricas do disco regional (uma das seguintes opções):
-
Leitor do Monitoring (
roles/monitoring.viewer
) no projeto -
Editor do Monitoring (
roles/monitoring.editor
) no projeto
-
Leitor do Monitoring (
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Monitorar usando o console do Google Cloud
Esta seção explica como monitorar os estados da réplica e o status de replicação de disco de um volume de Persistent Disk regional ou de Hyperdisk Balanced High Availability usando o console do Google Cloud.
Verificar se as réplicas zonais estão sincronizadas para um único disco
Use o console do Google Cloud para verificar se as réplicas zonais de um disco regional estão sincronizadas com os dados mais recentes do disco.
Para informações detalhadas sobre os estados exatos das réplicas zonais de todos os discos regionais em um projeto, verifique os estados da réplica zonal usando o painel do Cloud Monitoring.
Para monitorar os estados da réplica zonal dos discos regionais, faça o seguinte:
No console do Google Cloud, acesse a página Discos.
Na página Discos, na coluna Nome, selecione o disco para o qual você quer verificar os estados da réplica.
A página Gerenciar disco é aberta para o disco selecionado e exibe a guia Detalhes desse disco.
Clique na guia Observabilidade.
A página Gerenciar disco mostra as informações de monitoramento do disco.
Para conferir as informações históricas do estado da réplica do disco, na guia Observability, navegue até o gráfico Estado de replicação do disco permanente regional.
O gráfico exibe os valores de estado da réplica para suas réplicas zonais durante a hora anterior na forma de duas linhas separadas do gráfico.
O valor do estado da réplica pode ser um dos seguintes:
0
: a réplica não está sincronizada com os dados mais recentes do disco.1
: A réplica é sincronizada com os dados mais recentes do disco.
Para verificar o valor do estado da réplica para suas réplicas zonais em um momento específico, faça o seguinte:
- Mantenha o ponteiro no gráfico para o valor de tempo em que você quer verificar o estado da réplica.
- Para ver os valores de estado da réplica para suas réplicas zonais, navegue até a parte inferior do gráfico.
- Opcional: para ver o nome e o valor do estado da réplica indicados por uma linha do gráfico, mantenha o ponteiro sobre a linha do gráfico para qualquer valor de tempo específico. O gráfico destaca o nome e o estado específico de tempo da réplica em uma dica.
Opcional: para modificar o período em que você quer ver os dados do estado da réplica, selecione um período na parte de cima da guia Observability. As seguintes opções estão disponíveis:
- 1 hour: a hora anterior. Esse é o valor padrão.
- 6 horas: as 6 horas anteriores.
- 1 dia: o dia anterior.
- 1 semana: a semana anterior.
- 1 mês: o mês anterior.
- 6 semanas: as seis semanas anteriores.
Personalizado: é um período específico de sua escolha. Para especificar um período de monitoramento personalizado, clique em Personalizado e faça o seguinte:
- No campo Data e hora de início, especifique o início do período de monitoramento. Você deve especificar um horário no passado.
- No campo Data e hora de término, especifique o final do período de monitoramento. Você deve especificar um horário no passado.
- Para salvar o período de monitoramento personalizado, clique em Aplicar.
Determinar se o disco está totalmente replicado
Depois de determinar se as réplicas zonais estão ou não sincronizadas com os dados mais recentes do disco, use essas informações para determinar se o disco está ou não totalmente replicado.
A qualquer momento, o disco era totalmente replicado se o valor do estado da réplica
para as duas réplicas zonais fosse 1
. Se esse não for o caso, verifique os estados
de réplica exatos naquele momento para saber se o disco foi degradado ou
atualizado. Para mais informações, consulte
Monitorar usando métricas do Cloud Monitoring.
Monitorar usando métricas do Cloud Monitoring
É possível verificar informações detalhadas sobre os estados exatos das réplicas zonais de todos
os discos regionais usando a métrica Regional disk replica state
no Cloud Monitoring.
Sobre a métrica Regional disk replica state
É possível conferir os estados atuais e históricos das réplicas de disco das suas réplicas
zonais no painel do Cloud Monitoring.
O Compute Engine captura os estados de réplica dos discos a cada minuto e
os informa usando a métrica Regional disk replica state
. No entanto, se
houver uma falha temporária na zona que afeta a instância de computação à qual uma
réplica zonal está anexada, nenhum dado de métrica Regional disk replica state
será exibido para nenhuma réplica zonal.
Veja a seguir todos os valores possíveis para a métrica
Regional disk replica state
. Suas réplicas zonais estão sempre em um desses
estados de réplica de disco.
Synced
: a réplica está disponível, recebe de maneira síncrona todas as gravações executadas no disco e está atualizada com todos os dados no disco.CatchingUp
: a réplica está disponível, mas ainda está acessando os dados da outra réplica no disco.OutOfSync
: a réplica está temporariamente indisponível e dessincronizada com os dados no disco.
Para informações sobre a definição de métrica, consulte a seção Métricas do Monitoring do Compute Engine.
É possível usar os dados da métrica Regional disk replica state
para fazer o seguinte:
- Determine o status de replicação do disco regional.
- Analise o histórico do estado da réplica do disco regional para entender se a arquitetura de failover funciona conforme o esperado e tome as medidas necessárias caso o estado do disco regional mude.
- Crie alertas com base nos dados das métricas
Regional disk replica state
, detecte mudanças nos estados das réplicas e realize as ações necessárias. Para mais informações sobre como criar alertas com base em métricas, consulte Como adicionar uma política de alertas.
Verifique os dados da métrica Regional disk replica state
Para conferir o status das réplicas zonais de um disco regional
anexado, crie uma consulta e um gráfico temporário para a
métrica Regional disk replica state
. É possível fazer isso no Metrics Explorer usando a interface orientada por menu, a linguagem de consulta do Monitoring (MQL) ou o PromQL.
-
No Console do Google Cloud, acesse a página do leaderboard Metrics Explorer:
Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.
A página do Metrics Explorer é aberta e exibe a guia Consultas.
Na barra de ferramentas do painel de consulta, clique no botão com o nome que começa com < >.
No campo Language, selecione MQL como o idioma da consulta. Esse campo está na mesma barra de ferramentas que permite formatar sua consulta.
Opcional: desative o botão de alternância Execução automática.
Digite sua consulta e clique em Executar consulta.
Observação: quando a opção Execução automática está ativada, o botão Executar consulta não é exibido.
Por exemplo, para visualizar os dados de estado da réplica para um disco chamado
disk-1
, execute a seguinte consulta:fetch gce_disk | metric 'compute.googleapis.com/disk/regional/replica_state' | filter (metadata.system_labels.name == 'disk-=1') | group_by 1m, [value_replica_state_mean: mean(value.replica_state)] | every 1m
Como outro exemplo, para determinar qual porcentagem de tempo as réplicas foram sincronizadas para um disco chamado
disk-1
, execute a seguinte consulta:fetch gce_disk | metric 'compute.googleapis.com/disk/regional/replica_state' | filter (metadata.system_labels.name == 'disk-1') && (metric.state == 'Synced') | group_by 1m, [value_replica_state_mean: mean(value.replica_state)] | every 1m | group_by [metric.replica_zone], [value_replica_state_mean_mean: mean(value_replica_state_mean)]
Para modificar o período em que você quer monitorar os dados da métrica, na parte superior do painel, clique em Última hora e selecione o período e o fuso horário desejados.
É possível selecionar um período relativo à hora atual ou especificar os horários de início e término da sua escolha. Por padrão, você vê os dados de métricas da hora anterior.
-
No Console do Google Cloud, acesse a página do leaderboard Metrics Explorer:
Se você usar a barra de pesquisa para encontrar essa página, selecione o resultado com o subtítulo Monitoring.
A página do Metrics Explorer é aberta e exibe a guia Consultas.
Na barra de ferramentas do painel de consulta, clique no botão com o nome que começa com < >.
No campo Language, selecione PromQL como o idioma da consulta. Esse campo está na mesma barra de ferramentas que permite formatar sua consulta.
Opcional: desative o botão de alternância Execução automática.
Digite sua consulta e clique em Executar consulta.
Observação: quando a opção Execução automática está ativada, o botão Executar consulta não é exibido.
Por exemplo, para visualizar os dados de estado da réplica para um disco chamado
disk-1
, execute a seguinte consulta:avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",metadata_system_name="disk-1"}[${__interval}])
Como outro exemplo, para determinar qual porcentagem de tempo as réplicas foram sincronizadas para um disco chamado
disk-1
, execute a seguinte consulta:avg by (replica_zone)(avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",state="Synced",metadata_system_name="disk-1"}[${__interval}]))
Para modificar o período em que você quer monitorar os dados da métrica, na parte superior do painel, clique em Última hora e selecione o período e o fuso horário desejados.
É possível selecionar um período relativo à hora atual ou especificar os horários de início e término da sua escolha. Por padrão, você vê os dados de métricas da hora anterior.
Determinar os estados exatos da réplica zonal usando dados de métricas
Para entender os dados da métrica Regional disk replica state
de um
disco regional, verifique as colunas state e value
das réplicas zonais no gráfico gerado. Se você não adicionar filtros à sua consulta, o seguinte vai acontecer:
- A coluna state mostra todos os estados de réplica de disco possíveis
para uma réplica zonal, uma de
Synced
,CatchingUp
eOutOfSync
. O gráfico mostra cada um desses estados na forma de uma série temporal para todas as réplicas zonais de todos os discos regionais no seu projeto. - A coluna value indica se a réplica zonal está em um estado de réplica de disco específico ou não. Esta coluna mostra um
valor binário correspondente (
0
ou1
) para cada valor de estado em todas as réplicas zonais de todos os discos regionais no seu projeto.
Para qualquer réplica zonal, se a coluna value mostrar 1
para um estado de réplica de disco
específico, essa réplica zonal estará nesse
estado específico. Se a coluna value mostrar 0
para um estado específico, essa réplica não estará nesse estado. A qualquer momento, uma réplica zonal
tem exatamente um dos estados da réplica de disco com 1
na coluna value. Os outros dois estados de réplica de disco têm 0
nas respectivas colunas value.
Para cada réplica zonal, o gráfico e a tabela mostram uma entrada separada para cada estado da réplica do disco: Synced
, CatchingUp
e OutOfSync
.
A coluna valor de cada entrada é um valor binário (0
ou 1
) que
indica se a réplica está ou não nesse estado. A qualquer momento,
uma réplica zonal tem exatamente um estado de réplica com o valor 1
.
Determinar o status exato de replicação de disco
É possível usar os estados de réplica das suas réplicas zonais para determinar o estado de replicação dos discos regionais da seguinte maneira:
- Se as duas réplicas zonais tiverem
1
como o valor do estadoSynced
, o disco será totalmente replicado. - Se uma das réplicas zonais tiver
1
como o valor do estadoSynced
e a outra réplica zonal tiver1
como o valor do estadoCatchingUp
, o disco estará acompanhando. - Se uma das réplicas zonais tiver
1
como o valor do estadoSynced
e a outra réplica zonal tiver1
como o valor do estadoOutOfSync
, o disco estará degradado.
Por exemplo, considere um disco chamado my-disk1
que tem réplicas em
us-central1-a
e us-central1-b
. Os cenários a seguir mostram os valores
das colunas state e value para as réplicas zonais para cada
estado de replicação possível de my-disk1
:
Nesse cenário, a réplica em us-central1-a
e a réplica em
us-central1-b
são atualizadas com os dados mais recentes no disco. O gráfico exibe os seguintes valores para cada estado de réplica do disco para as réplicas zonais de my-disk1
:
replica_zone | state | value |
---|---|---|
us-central1-a |
Synced |
1 |
us-central1-a |
CatchingUp |
0 |
us-central1-a |
OutOfSync |
0 |
us-central1-b |
Synced |
1 |
us-central1-b |
CatchingUp |
0 |
us-central1-b |
OutOfSync |
0 |
Nesse cenário, a réplica em us-central1-a
é atualizada com os dados no disco, e a réplica em us-central1-b
está alcançando os dados no disco. O gráfico exibe os seguintes valores para cada estado de réplica de disco das réplicas zonais de my-disk1
:
replica_zone | state | value |
---|---|---|
us-central1-a |
Synced |
1 |
us-central1-a |
CatchingUp |
0 |
us-central1-a |
OutOfSync |
0 |
us-central1-b |
Synced |
0 |
us-central1-b |
CatchingUp |
1 |
us-central1-b |
OutOfSync |
0 |
Nesse cenário, a réplica em us-central1-a
é atualizada com os dados no disco e a réplica em us-central1-b
está dessincronizada. O gráfico exibe os seguintes valores para cada estado de réplica do disco para as réplicas zonais de my-disk1
:
replica_zone | state | value |
---|---|---|
us-central1-a |
Synced |
1 |
us-central1-a |
CatchingUp |
0 |
us-central1-a |
OutOfSync |
0 |
us-central1-b |
Synced |
0 |
us-central1-b |
CatchingUp |
0 |
us-central1-b |
OutOfSync |
1 |