Comutação por falha e recuperação de discos assíncronos


Este documento descreve como fazer failover e failback de discos de replicação assíncrona.

Em caso de indisponibilidade na região principal, é da sua responsabilidade identificar a indisponibilidade e reiniciar a carga de trabalho através dos discos secundários na região secundária. A replicação assíncrona não oferece monitorização de interrupções. Pode identificar uma indisponibilidade através das métricas de RPO, verificações de estado>, métricas específicas da aplicação e contactando o apoio técnico ao cliente da Google Cloud.

Após uma comutação por falha da região principal para a região secundária, a região secundária torna-se a região principal em vigor.

Após a resolução da indisponibilidade ou do desastre, pode iniciar a reversão para iniciar a replicação a partir da região secundária original (a região principal em funcionamento) para a região principal original. Opcionalmente, pode repetir o processo para mover a carga de trabalho de volta para a região principal original. A mudança da carga de trabalho de volta para a região principal original não é estritamente necessária, mas pode ser feita com base nos requisitos de recuperação de desastres, como a localidade ou os recursos disponíveis.

Para saber mais sobre a comutação por falha e a recuperação de falhas, consulte o artigo Acerca da replicação assíncrona.

Comutação por falha para a região secundária

Quando identificar que ocorreu um desastre, inicie a comutação por falha para a região secundária. Uma comutação por falha move a carga de trabalho da região principal para a região secundária. Após a comutação por falha, o disco secundário é o disco principal em funcionamento e a região secundária é a região principal em funcionamento.

Pode fazer failover de um único disco ou de todos os discos num grupo de consistência.

Disco único

Para fazer failover de um único disco, faça o seguinte:

  1. Pare a replicação de discos.
  2. Se ainda não tiver uma VM na mesma região que o disco secundário, crie uma.
  3. Anexe o disco secundário à VM:

    O disco secundário é agora o disco principal da carga de trabalho e a região secundária é a região principal.

Grupo de consistência

Para fazer failover de um grupo de consistência, faça o seguinte:

  1. Pare a replicação do grupo de consistência.
  2. Se ainda não tiver VMs na mesma região que os discos secundários, crie-as.
  3. Anexe os discos secundários às VMs:

Retorno à região principal original

Depois de um desastre ser resolvido, inicie uma reversão para a região principal original. Uma reversão configura e inicia a replicação a partir do disco principal em funcionamento para um novo disco secundário na região secundária em funcionamento.

Pode fazer o failback de um único disco ou de todos os discos num grupo de consistência.

Disco único

Para fazer o failback de um único disco, faça o seguinte:

  1. Crie um disco secundário na região secundária de atuação. A região secundária em vigor é a região principal original.
  2. Inicie a replicação do disco principal em funcionamento para o novo disco secundário.
  3. Opcional: mova a carga de trabalho da região principal em funções para a região principal original fazendo o seguinte:

    1. Aguarde a conclusão da replicação inicial. A replicação inicial fica concluída quando a métrica disk/async_replication/time_since_last_replication está disponível no Cloud Monitoring. Se não vir a métrica RPO no Cloud Explorer, significa que a replicação inicial não está concluída.
    2. Recomendado: para evitar a perda de dados, agende o tempo de inatividade para a carga de trabalho e coloque a carga de trabalho offline.
    3. Parar replicação.
    4. Anexe o disco secundário a uma VM:

      O disco secundário é agora o disco principal da carga de trabalho na região principal original.

    5. Reconfigure a replicação na região principal original da seguinte forma:

      1. Crie um novo disco secundário na região secundária original.
      2. Inicie a replicação do disco principal para o novo disco secundário.

Grupo de consistência

Para fazer o failback de um grupo de consistência, faça o seguinte:

  1. Crie um novo grupo de consistência na região principal de atuação. A região principal em vigor é a região secundária original.
  2. Adicione os discos principais ativos ao grupo de consistência
  3. Crie discos secundários na região secundária ativa que referenciam os discos primários ativos.
  4. Inicie a replicação.
  5. Opcional: mova a carga de trabalho da região principal em funções para a região principal original fazendo o seguinte:

    1. Aguarde a conclusão da replicação inicial. A replicação inicial fica concluída quando a métrica RPO está disponível. Se não vir a métrica RPO no Cloud Explorer, significa que a replicação inicial não está concluída.
    2. Recomendado: para evitar a perda de dados, agende o tempo de inatividade para a carga de trabalho e coloque a carga de trabalho offline.
    3. Parar replicação.
    4. Anexe o disco secundário às VMs:

      Os discos secundários são agora os discos principais da carga de trabalho na região principal original.

    5. Reconfigure a replicação na região principal original da seguinte forma:

      1. Adicione os discos principais ao grupo de consistência original.
      2. Crie novos discos secundários na região secundária original.
      3. Inicie a replicação.

O que se segue?