Visão geral da configuração de alta disponibilidade

Esta página é uma visão geral da configuração de alta disponibilidade (HA, na sigla em inglês) de instâncias do Cloud SQL. Para configurar uma nova instância de alta disponibilidade ou para ativá-la em uma instância existente, consulte Como ativar e desativar a alta disponibilidade em uma instância.

Visão geral da configuração de alta disponibilidade

A configuração de alta disponibilidade, também chamada de cluster, fornece redundância de dados. Uma instância do Cloud SQL configurada para alta disponibilidade também é chamada de instância regional e está localizada em uma zona primária e secundária dentro da região configurada. Em uma instância regional, a configuração é composta de uma instância primária e uma instância de espera. Por meio da replicação síncrona no disco permanente de cada zona, todas as gravações feitas na instância primária também são feitas na instância de espera. No caso de uma falha na instância ou zona, essa configuração reduz o tempo de inatividade e seus dados continuam disponíveis para aplicativos cliente.

O suporte regional de DP para o Cloud SQL e a configuração de alta disponibilidade do Cloud SQL estão em GA com cobertura total de SLA. Uma instância configurada com alta disponibilidade é cobrada ao dobro do preço de uma instância independente. Isso inclui CPU, RAM e armazenamento. Para mais informações, consulte a página de preços.

Visão geral do diagrama da configuração de alta disponibilidade do Cloud SQL. Descrita no texto abaixo.

Visão geral de failover

Se uma instância configurada para alta disponibilidade deixar de responder, o Cloud SQL passará a disponibilizar dados automaticamente a partir da instância de espera. É isso que chamamos de failover. Para ver se ocorreu algum, verifique o histórico de failover do seu registro de operação.

Clique nas guias para ver como o failover afeta sua instância.

Normal

Diagrama da instância íntegra antes do failover

Failover

Diagrama da instância quando ocorre failover

Failback

Diagrama da instância após o failback

Process

Ocorre o seguinte processo:

  • A instância ou zona primária falha.

    A cada segundo, a instância primária grava em um banco de dados do sistema como um sinal de funcionamento. Se não forem detectados vários sinais de funcionamento, o failover será iniciado. Isso ocorrerá se a instância primária não responder por aproximadamente 60 segundos ou se a zona que contém a instância primária sofrer uma interrupção.

  • Agora, a instância de espera disponibiliza dados logo após a reconexão.

    Por meio de um endereço IP estático compartilhado com a instância primária, a instância de espera agora disponibiliza dados da zona secundária.

Requisitos

Para o Cloud SQL permitir um failover, a configuração deve atender aos seguintes requisitos:

  • A instância primária precisa estar em um estado operacional normal (em oposição a um estado de interrupção, de manutenção ou de uma operação de longa duração).
  • A zona secundária e a instância de espera devem estar em estado íntegro. Quando a instância de espera não responde e/ou a replicação para a zona secundária é interrompida, as operações de failover são bloqueadas. Após o Cloud SQL consertar a instância de espera e a zona secundária é disponibilizada, a replicação é retomada e o Cloud SQL permite o failover.

Backup e restauração

Os backups automatizados e a recuperação pontual precisam ser ativados para alta disponibilidade (a recuperação pontual usa registros write-ahead).

Aplicativos e instâncias

Não há diferença entre trabalhar com instâncias de alta disponibilidade e instâncias comuns, portanto, seu aplicativo não precisa ser configurado de alguma maneira específica. Quando ocorre um failover, todas as conexões existentes com a instância primária e as réplicas de leitura são fechadas, e leva aproximadamente de 2 a 3 minutos para que as conexões sejam restabelecidas. Seu aplicativo é reconectado usando a mesma string de conexão ou endereço IP, portanto, não é necessário atualizar seu aplicativo após o failover.

Para ver exatamente como seus aplicativos são afetados pelo failover, inicie-o manualmente.

Inatividade de manutenção

Os eventos de manutenção afetam as instâncias principais configuradas com alta disponibilidade da mesma forma que qualquer outra instância. As instâncias principais podem ficar inativas durante esse período. Para minimizar o impacto no serviço, é necessário definir uma janela de manutenção para controlar quando o tempo de inatividade ocorre.

Quando uma manutenção é feita em uma instância, ela não faz o failover para a instância de espera. As atualizações de manutenção são aplicadas à instância de espera ao mesmo tempo que à instância principal.

A seguir