Visão geral da configuração de alta disponibilidade

Esta página é uma visão geral da configuração de alta disponibilidade (HA, na sigla em inglês) de instâncias do Cloud SQL. Para configurar uma nova instância de alta disponibilidade ou para ativá-la em uma instância existente, consulte Como ativar e desativar a alta disponibilidade em uma instância.

Visão geral da configuração de alta disponibilidade

A configuração de alta disponibilidade, também chamada de cluster, fornece redundância de dados. Uma instância do Cloud SQL configurada para alta disponibilidade também é chamada de instância regional e está localizada em uma zona primária e secundária dentro da região configurada. Em uma instância regional, a configuração é composta de uma instância primária e uma instância de espera. Por meio da replicação síncrona no disco permanente de cada zona, todas as gravações feitas na instância primária também são feitas na instância de espera. No caso de uma falha na instância ou zona, essa configuração reduz a inatividade, e seus dados continuam disponíveis aos aplicativos cliente.

Observação: a instância de espera não pode ser usada para consultas de leitura. Isso é diferente da configuração de alta disponibilidade legada do Cloud SQL para MySQL.

O suporte regional de DP para o Cloud SQL e a configuração de alta disponibilidade do Cloud SQL estão em GA com cobertura total do SLA. Uma instância configurada com alta disponibilidade é cobrada ao dobro do preço de uma instância independente. Isso inclui CPU, RAM e armazenamento. Para mais informações, consulte a página de preços.

Visão geral do diagrama da configuração de alta disponibilidade do Cloud SQL. Descrita no texto abaixo.

Visão geral de failover

Se uma instância configurada para alta disponibilidade deixar de responder, o Cloud SQL passará a disponibilizar dados automaticamente a partir da instância de espera. É isso que chamamos de failover. Para ver se ocorreu algum, verifique o histórico de failover do seu registro de operação.

Clique nas guias para ver como o failover afeta sua instância.

Normal

Diagrama da instância íntegra antes do failover

Failover

Diagrama da instância quando ocorre failover

Failback

Diagrama da instância após o failback

Process

Ocorre o seguinte processo:

  • A instância ou zona primária falha.

    A cada segundo, a instância primária grava em um banco de dados do sistema como um sinal de funcionamento. Se não forem detectados vários sinais de funcionamento, o failover será iniciado. Isso ocorrerá se a instância primária não responder por aproximadamente 60 segundos ou se a zona que contém a instância primária sofrer uma interrupção.

  • Agora, a instância de espera disponibiliza dados logo após a reconexão.

    Por meio de um endereço IP estático compartilhado com a instância primária, a instância de espera agora exibe os dados da zona secundária.

Requisitos

Para o Cloud SQL permitir um failover, a configuração deve atender aos seguintes requisitos:

  • A instância primária precisa estar em um estado operacional normal (em oposição a um estado de interrupção, de manutenção ou de uma operação de longa duração).
  • A zona secundária e a instância de espera devem estar em estado íntegro. Quando a instância de espera não responde e/ou a replicação para a zona secundária é interrompida, as operações de failover são bloqueadas. Após o Cloud SQL consertar a instância de espera e a zona secundária é disponibilizada, a replicação é retomada e o Cloud SQL permite o failover.

Backup e restauração

Os backups automatizados e a recuperação pontual precisam ser ativados para alta disponibilidade (a recuperação pontual usa a geração de registros binários).

Aplicativos e instâncias

Não há diferença entre trabalhar com instâncias de alta disponibilidade e instâncias comuns, portanto, seu aplicativo não precisa ser configurado de alguma maneira específica. Quando ocorre um failover, todas as conexões existentes com a instância primária e as réplicas de leitura são fechadas, e leva aproximadamente de 2 a 3 minutos para que as conexões sejam restabelecidas. Seu aplicativo é reconectado usando a mesma string de conexão ou endereço IP, portanto, não é necessário atualizar seu aplicativo após o failover.

Para ver exatamente como seus aplicativos são afetados pelo failover, inicie-o manualmente.

Inatividade de manutenção

Os eventos de manutenção afetam as instâncias principais configuradas com alta disponibilidade da mesma forma que qualquer outra instância. As instâncias principais podem ficar inativas durante esse período. Para minimizar o impacto no serviço, é necessário definir uma janela de manutenção para controlar quando o tempo de inatividade ocorre.

Quando uma manutenção é feita em uma instância, ela não faz o failover para a instância de espera. As atualizações de manutenção são aplicadas à instância de espera ao mesmo tempo que à instância primária.

Desempenho

O desempenho do disco permanente regional depende de muitos fatores. Veja especificamente o tamanho do tipo de instância da VM e a entrada e a saída da sua carga de trabalho. Outra métrica a ser observada é que a latência do disco permanente regional com unidades de estado sólido (SSDs, na sigla em inglês) será maior do que aquela do disco permanente com SSD local. Isso significa que, se a carga de trabalho não for de streaming e sensível à latência, ela não alcançará o limite de operações de entrada/saída por segundo (IOPS), já que o disco permanente regional com SSD tem uma latência maior do que um disco permanente com SSD local. Isso acontece porque a redundância necessária para gravar duas cópias aumenta a latência de cauda.

Opção de alta disponibilidade legada do MySQL

Até o 1º trimestre de 2021, você tem a opção de usar o processo legado para adicionar a alta disponibilidade às instâncias do MySQL, o que usa uma réplica de failover. A funcionalidade legada não está disponível no Console do Cloud. Em vez disso, use os comandos gcloud ou cURL. Consulte Configuração legada: como criar uma nova instância configurada para alta disponibilidade ou Configuração legada: como configurar uma instância atual para alta disponibilidade.

A seguir