Sobre a alta disponibilidade

Esta página é uma visão geral da configuração de alta disponibilidade (HA, na sigla em inglês) de instâncias do Cloud SQL. Para configurar uma nova instância de alta disponibilidade ou para ativá-la em uma instância existente, consulte Como ativar e desativar a alta disponibilidade em uma instância.

Visão geral da configuração de alta disponibilidade

A finalidade de uma configuração de alta disponibilidade é reduzir a inatividade quando uma zona ou instância fica indisponível. Isso pode acontecer durante uma falha temporária na zona ou quando há um problema de hardware. A alta disponibilidade permite que seus dados continuem disponíveis para aplicativos cliente.

A configuração de alta disponibilidade oferece redundância de dados. Uma instância do Cloud SQL configurada para alta disponibilidade também é chamada de instância regional e tem uma zona primária e secundária* dentro da região configurada. Em uma instância regional, a configuração é composta de uma instância primária e uma instância de espera. Por meio da replicação síncrona no disco permanente de cada zona, todas as gravações feitas na instância principal são replicadas nos discos das duas zonas antes que uma transação seja relatada como confirmada. No caso de uma falha na instância ou zona, a instância em espera se tornará a nova instância primária. Os usuários então serão redirecionados para a nova rede principal. Esse processo é chamado de failover.

Após um failover, a instância que recebeu o failover continua sendo a instância principal, mesmo depois que a instância original fique on-line novamente. Depois que a zona ou instância que apresentou uma interrupção ficar novamente disponível, a instância primária original será destruída e recriada. Em seguida, ela se torna a nova instância de espera. Se ocorrer um failover no futuro, a nova instância primária fará o failover para a instância original na zona original.

Se a instância principal estiver na zona que teve a interrupção, será possível fazer um failback. O failback executa as mesmas etapas do failover, mas somente na direção oposta, para redirecionar o tráfego de volta para a instância original. Para executar um failback, use o procedimento em Como iniciar o failover.

O suporte ao disco permanente regional para a configuração de alta disponibilidade do Cloud SQL que tem pelo menos uma CPU dedicada tem cobertura total do contrato de nível de serviço (SLA). Uma instância configurada de alta disponibilidade custa o dobro de uma instância autônoma. Esse preço inclui CPU, RAM e armazenamento. Para mais informações, consulte a página de preços.

Visão geral do diagrama da configuração de alta disponibilidade do Cloud SQL. Descrita no texto abaixo.

* As regiões do México, de Montreal e de Osaka têm três zonas em um ou dois data centers físicos. Essas regiões estão em processo de expansão para pelo menos três data centers físicos. Para mais informações, consulte Locais do Cloud e SLAs do Google Cloud Platform. Para melhorar a confiabilidade das cargas de trabalho, considere uma implantação multirregional.

Réplicas de leitura

Se a disponibilidade for uma consideração para suas réplicas de leitura, é possível ativar a alta disponibilidade nas réplicas. Quando você promove essa réplica para se tornar uma instância principal, ela já está configurada como uma instância altamente disponível.

Durante uma falha temporária zonal, o tráfego para de ler réplicas na zona. Quando a zona ficar disponível novamente, qualquer réplica de leitura na zona retomará a replicação da instância principal. Se as réplicas de leitura não estiverem localizadas em uma zona que está passando por uma falha temporária, elas se conectarão à instância em espera quando ela se tornar a instância principal.

Como prática recomendada, coloque algumas das réplicas de leitura em uma zona diferente das instâncias primária e de espera. Por exemplo, se você tiver uma instância primária na zona A e uma instância em espera na zona B, coloque uma réplica de leitura na zona C para melhorar a confiabilidade. Essa prática garante que as réplicas de leitura continuem a operar mesmo que a zona da instância primária fique inativa. Também é necessário adicionar lógica de negócios ao aplicativo cliente para enviar leituras à instância principal quando as réplicas de leitura estiverem indisponíveis.

Visão geral de failover

Se uma instância configurada para alta disponibilidade deixar de responder, o Cloud SQL passará a disponibilizar dados automaticamente a partir da instância de espera. Para ver se ocorreu algum failover, consulte o histórico de failover do registro de operações.

Saiba mais sobre como criar consultas no Explorador de registros. Se você precisar de informações mais detalhadas sobre uma operação, como o usuário que a executou, ative a geração de registros de auditoria.

Clique nas guias para ver como o failover afeta sua instância.

Normal

Diagrama da instância íntegra antes do failover

Failover

Diagrama da instância quando ocorre failover

Pós-failover

Diagrama da instância após o failover

Failback

Diagrama da instância após o failback

Processo

Ocorre o seguinte processo:

  • A instância ou zona primária falha.

    A cada segundo, o sistema de batimento cardíaco detecta se a instância principal está integrada. Se não forem detectados vários sinais de funcionamento, o failover será iniciado.

  • Agora, a instância de espera disponibiliza dados logo após a reconexão.

    Por meio de um endereço IP estático compartilhado com a instância primária, a instância de espera agora disponibiliza dados da zona secundária.

Requisitos

Para o Cloud SQL permitir um failover, a configuração deve atender aos seguintes requisitos:

  • A instância primária precisa estar em um estado operacional normal (em oposição a um estado de execução, manutenção ou execução de uma operação de instância do Cloud SQL de longa duração, como operação de backup).
  • A zona secundária e a instância de espera devem estar em estado íntegro. Quando a instância em espera não responde, as operações de failover são bloqueadas. Depois que o Cloud SQL repara a instância de espera e a zona secundária está disponível, o Cloud SQL permite failover.

Backup e restauração

Os backups automatizados são altamente recomendados para alta disponibilidade.

Aplicativos e instâncias

Não há diferença entre trabalhar com instâncias de alta disponibilidade e instâncias comuns, portanto, seu aplicativo não precisa ser configurado de alguma maneira específica. Quando ocorre um failover, todas as conexões existentes com a instância principal e as réplicas de leitura são fechadas, e leva aproximadamente de 60 segundos para que as conexões com a instância principal sejam restabelecidas. Seu aplicativo é reconectado usando a mesma string de conexão ou endereço IP, portanto, não é necessário atualizar seu aplicativo após o failover.

Para ver exatamente como seus aplicativos são afetados pelo failover, inicie-o manualmente.

Inatividade de manutenção

Os eventos de manutenção afetam as instâncias principais configuradas com alta disponibilidade da mesma maneira que outras instâncias. As instâncias principais podem ficar inativas por um breve período. Para mais informações sobre como a manutenção afeta as instâncias de alta disponibilidade, consulte Como funciona a manutenção. Para minimizar o impacto no serviço, altere as configurações de manutenção para controlar quando o tempo de inatividade ocorre.

A seguir