Sobre a replicação no Cloud SQL

A replicação é a capacidade de criar cópias de uma instância do Cloud SQL ou de um banco de dados local e distribuir o trabalho para as cópias.

Introdução

O principal motivo para usar a replicação é a possibilidade de escalonar o uso dos dados em um banco de dados sem prejudicar o desempenho.

Outros motivos incluem:

  • migrar dados entre regiões;
  • migrar dados entre plataformas;
  • migrar dados de um banco de dados local para o Cloud SQL.

Além disso, uma réplica poderá ser promovida se a instância original for corrompida.

Ao se referir a uma instância do Cloud SQL, a instância que é replicada é chamada de instância primária, e as cópias são chamadas de réplicas de leitura. A instância primária e as réplicas de leitura residem no Cloud SQL.

Ao se referir a um banco de dados local, o cenário de replicação é chamado de replicação a partir de um servidor externo. Nesse cenário, o banco de dados que é replicado é o servidor do banco de dados de origem. As cópias que residem no Cloud SQL são chamadas de réplicas do Cloud SQL. Há também uma instância que representa o servidor do banco de dados de origem no Cloud SQL chamada de instância de representação de origem.

Em um cenário de recuperação de desastres, você pode promover uma réplica para a converter em uma instância principal. Dessa forma, é possível usá-la em vez de uma instância que esteja em uma região com uma falha temporária. Também é possível promover uma réplica para substituir uma instância corrompida.

O Cloud SQL é compatível com os seguintes tipos de réplica:

Também é possível usar o Database Migration Service para replicação contínua de um servidor de banco de dados de origem para o Cloud SQL. Observação: o Cloud SQL permite que os usuários gerenciem a própria replicação usando recursos de replicação lógica do PostgreSQL.

O Cloud SQL não oferece suporte à replicação entre dois servidores externos.

Réplicas de leitura

Você usará uma réplica de leitura para distribuir o trabalho de uma instância do Cloud SQL. A réplica de leitura é uma cópia exata da instância primária. Os dados e outras alterações na instância primária são atualizados quase em tempo real na réplica de leitura.

As réplicas de leitura são somente para leitura. Portanto, não é possível fazer gravações nelas. A réplica de leitura processa consultas, solicitações de leitura e tráfego de análise, reduzindo a carga na instância primária.

Você se conecta a uma réplica diretamente usando o nome de conexão e o endereço IP dela. Caso esteja se conectando a uma réplica usando um endereço IP particular, você não precisará criar mais uma conexão particular da VPC para a réplica, porque ela é herdada da instância principal.

Para informações sobre como criar uma réplica de leitura, consulte Como criar réplicas de leitura. Para informações sobre como gerenciar uma réplica de leitura, consulte Como gerenciar réplicas de leitura.

Como prática recomendada, coloque réplicas de leitura em uma zona diferente da instância principal quando usar a alta disponibilidade nessa instância. Essa prática garante que as réplicas de leitura continuem a operar quando a zona que contém a instância principal tiver uma interrupção. Consulte a Visão geral da alta disponibilidade para mais informações.

Como selecionar um tipo de máquina apropriado

As réplicas de leitura podem ter um tipo de máquina diferente da principal. É necessário monitorar métricas na instância, como o uso de CPU e memória, para garantir que a instância da réplica esteja dimensionada corretamente para a carga de trabalho, especialmente se ela for menor do que a instância principal. Uma instância de réplica que tiver um tamanho menor é mais propensa a um desempenho ruim, como eventos frequentes de memória insuficiente (OOM, na sigla em inglês).

Impacto na sinalização max_connections quando a réplica de leitura tem um tipo de máquina com menos memória do que a principal

Em uma instância do PostgreSQL, se a sinalização max_connections não for definida como um valor de sua escolha, o Cloud SQL a definirá automaticamente com base na quantidade de memória da instância. Para mais informações, consulte as sinalizações aceitas. O PostgreSQL exige que o valor de max_connections seja sempre pelo menos tão grande quanto sua réplica principal na leitura. Portanto, se uma réplica de leitura tiver menos memória que a principal e você não tiver definido a sinalização max_connections, ela poderá herdar um valor maior de max_connections com base no tamanho da instância principal. Nessa situação, se você confiar na configuração max_connections para limitar o número de conexões à instância da réplica, ela poderá ficar sobrecarregada porque o valor é muito alto em relação ao tipo de máquina de instância. Para evitar que isso aconteça, você pode fazer o seguinte:

  1. Redimensione a instância da réplica para um tipo de máquina maior.
  2. Configure seu aplicativo cliente para limitá-lo a algumas conexões que sejam menores do que o valor de max_connections.
  3. Defina a sinalização max_connections na instância principal e a réplica como um valor apropriado.

Operações de índice de hash usando réplicas de leitura

As operações de índice de hash não usam o write-ahead-logging para o PostgreSQL 9.6. O Cloud SQL tem apenas uma versão disponível no PostgreSQL 10. Isso está documentado na caixa de cuidado amarela da página de lançamento do PostgreSQL. Isso também se aplica a réplicas de leitura do Cloud SQL.

Como as atualizações do índice de hash não são propagadas para a réplica de leitura no PostgreSQL 9.6, elas não podem ser usadas pela réplica. Como solução alternativa, você pode não usar réplicas de leitura ou fazer upgrade para uma versão principal do PostgreSQL (10 ou mais recente).

Réplicas de leitura entre regiões

A replicação entre regiões permite criar uma réplica de leitura em uma região diferente da instância primária. Você cria uma réplica de leitura entre regiões da mesma maneira que cria uma réplica na região.

Réplicas entre regiões:

  • melhoram o desempenho de leitura disponibilizando réplicas mais próximas da região do aplicativo;
  • fornecem capacidade adicional de recuperação de desastres para oferecer proteção contra uma falha regional;
  • permitem migrar dados de uma região para outra.

Consulte Como promover réplicas para migração regional ou recuperação de desastres para mais informações sobre réplicas entre regiões.

Réplicas de leitura em cascata

A replicação em cascata permite criar uma réplica de leitura sob outra réplica de leitura na mesma região ou em uma região diferente. Veja abaixo alguns casos de uso de réplicas em cascata:

  • Recuperação de desastres: é possível usar uma hierarquia em cascata de réplicas de leitura para simular a topologia da instância principal e das réplicas de leitura. Durante uma falha temporária, sua réplica de leitura selecionada é promovida para primária e as réplicas de leitura sob a nova primária continuam a ser replicadas e estão prontas para uso.
  • Melhorias de desempenho: reduza a carga na instância principal descarregando o trabalho de replicação em várias réplicas de leitura.
  • Leituras em escala: é possível ter mais réplicas para compartilhar a carga de leitura.
  • Redução de custos: é possível reduzir custos de rede usando uma única réplica em cascata com replicação entre regiões em outras regiões.

Terminologia

  • Réplica em cascata: uma réplica de leitura que tem a própria réplica.
  • Níveis: é possível criar níveis de réplicas em uma hierarquia de réplicas em cascata. Por exemplo, se você adicionar quatro réplicas a uma instância, essas quatro réplicas estarão no mesmo nível.
  • Instâncias semelhantes: várias réplicas que se replicam da mesma instância principal. As semelhantes estão no mesmo nível na hierarquia de réplicas. Uma réplica pode ter oficialmente até nove semelhantes.
  • Réplica de folha: uma réplica de leitura que não tem réplicas próprias. Em uma hierarquia de replicação com vários níveis, a réplica de folha é o último nível.
  • Promover: uma ação que converte uma réplica, em qualquer nível na hierarquia, em uma instância principal. Quando promovida, a hierarquia de réplica em cascata da réplica é retida.

Configurar réplicas em cascata

As réplicas em cascata permitem adicionar réplicas de leitura a qualquer réplica atual. É possível adicionar até quatro níveis de réplicas, incluindo a instância principal. Quando você promove a réplica no topo de uma hierarquia de réplicas em cascata, ela se torna uma instância principal e as réplicas em cascata continuam a ser replicadas.

Para planejar sua configuração, é preciso ter uma meta para o que as réplicas de leitura pretendem fazer. As duas seções a seguir descrevem as configurações para recuperação de desastres e replicação multirregional.

Recuperação de desastres

Para entender como as réplicas em cascata ajudam você a se recuperar rapidamente durante uma falha temporária, considere o seguinte cenário de replicação:

Configuração

Diagrama de uma configuração de réplica em cascata com a réplica
             em cascata em uma região separada

Falha temporária

Diagrama da promoção durante uma falha temporária

Promoção

Diagrama da nova instância com réplicas

Se você quiser usar uma instância da Região B em uma configuração de recuperação de desastres e tiver:

  • réplicas na mesma região anexada à instância principal (Réplica A)
  • réplicas em outras regiões (réplica em cascata) anexadas à primária.

É possível criar réplicas de leitura na réplica em cascata na Região B.

Na guia Falha temporária, se houver uma interrupção na Região A, a réplica em cascata será promovida a uma instância principal. Ela já tem réplicas de leitura abaixo dela, reduzindo o objetivo de tempo de recuperação (RTO, na sigla em inglês).

Na guia Promover, você vê que, quando uma réplica em cascata é promovida, as réplicas dela também são promovidas e continuam a ser replicadas sob ela.

Replicação multirregional

Outro caso de uso de réplicas em cascata é distribuir a capacidade de leitura para uma segunda região de maneira econômica. É possível criar réplicas em C e D em cascata que replicam a partir da réplica B. Os clientes podem distribuir consultas de leitura entre as réplicas B, C e D para reduzir a carga em cada réplica. O custo do tráfego de rede entre regiões é gerado apenas uma vez, desde a instância principal até a réplica B. A replicação de B para C e D usa a transferência de rede dentro da região, que é gratuita.

É possível criar uma hierarquia de até quatro instâncias usando réplicas em cascata para replicação multirregional:

Principal A → Réplica B → Réplica C e Réplica D

Restrições

  • Não é possível excluir uma réplica que tenha réplicas sob ela. Para excluir a réplica, comece com as réplicas de folha e siga para cima na hierarquia.
  • A dependência de região circular não é compatível. Para ter a réplica de uma réplica em cascata na mesma região da instância principal, a réplica em cascata também precisa estar na mesma região.

Replicação lógica

O Cloud SQL permite configurar as próprias soluções de replicação usando os recursos de replicaçãovlógica do PostgreSQL. A replicação lógica é uma solução flexível que permite:

  • Replicação padrão de uma instância principal para uma réplica
  • Replicação seletiva de apenas determinadas tabelas ou linhas
  • Replicação nas versões principais do PostgreSQL
  • Replicação para bancos de dados que não sejam do PostgreSQL
  • Fluxos de trabalho de captura de dados de alterações (CDC, na sigla em inglês), em que todas as alterações do banco de dados são transmitidas para um consumidor.

Para mais informações, consulte Como configurar a replicação lógica. Nessa página, há informações sobre:

  • Replicação lógica nativa
  • Extensão pglogical

Casos de uso da replicação

Os casos de uso a seguir se aplicam a cada tipo de replicação.

Nome Linha Réplica Benefícios e casos de uso Mais informações
Réplica de leitura Instância do Cloud SQL Instância do Cloud SQL
  • Capacidade de leitura adicional
  • Destino do Analytics
Réplica de leitura entre regiões Instância do Cloud SQL Instância do Cloud SQL
  • Capacidade de leitura adicional
  • Destino do Analytics
  • Capacidade adicional de recuperação de desastres
  • Melhorar o desempenho da leitura
  • Migrar dados entre regiões
Replicação lógica Qualquer instância do PostgreSQL Qualquer instância do PostgreSQL ou um consumidor externo
  • Replicação de fora do Cloud SQL
  • Replicação nas versões do PostgreSQL
  • replicar apenas um subconjunto de dados em algumas tabelas, usando filtragem de linha e coluna; Veja também pglogical 2.1 e replicação lógica no PostgreSQL 10.
  • Replicação para destinos que não são do PostgreSQL (alterar a captura de dados)

Faturamento

  • Uma réplica de leitura é cobrada segundo a mesma taxa de uma instância padrão do Cloud SQL. Não há cobrança pela replicação de dados.
  • O preço de uma réplica de leitura entre regiões é igual ao de criar uma nova instância do Cloud SQL na região. Consulte Preços de instâncias do Cloud SQL e selecione a região apropriada. Além do custo normal associado à instância, uma réplica entre regiões gera cobranças de transferência de dados entre regiões referentes aos registros de replicação enviados da instância primária para a de réplica, conforme descrito em Preços de saída da rede.

Referência rápida para réplicas de leitura do Cloud SQL

Tópico Discussão
Backups Você não pode configurar backups na réplica.
Núcleos e memória As réplicas de leitura podem usar um número diferente de núcleos e uma quantidade diferentes de memória daqueles da instância primária.
Como excluir a instância principal Antes de excluir uma instância principal, você precisa promover todas as réplicas de leitura dela para instâncias independentes ou remover as réplicas.
Como excluir a réplica Quando você exclui uma réplica, não há impacto no status da instância principal.
Como desativar a geração de registros de gravação antecipada Antes de desativar os registros de gravação antecipada em uma instância principal, é preciso promover ou excluir todas as réplicas de leitura dela.
Failover Não é possível fazer o failover de uma instância principal para uma réplica de leitura. Além disso, as réplicas de leitura não realizam qualquer tipo de failover durante uma interrupção.
Alta disponibilidade As réplicas de leitura permitem que você ative a alta disponibilidade nas réplicas.
Balanceamento de carga O Cloud SQL não fornece balanceamento de carga entre réplicas. É possível implementar o balanceamento de carga na instância do Cloud SQL. Também é possível usar o pool de conexão para distribuir consultas entre as réplicas com a configuração de balanceamento de carga para ter melhor desempenho.
Janelas de manutenção Não é possível definir janelas de manutenção em réplicas de leitura. Além disso, elas não compartilham as janelas de manutenção com a instância principal. A manutenção pode ocorrer a qualquer momento na réplica de leitura. Porém, ela não acontece no mesmo horário que a manutenção da instância principal.
Várias réplicas de leitura O Cloud SQL tem suporte a réplicas em cascata. Como resultado, é possível criar até 10 réplicas para uma única instância principal, e as réplicas podem ser encadeadas para até quatro níveis, incluindo a principal.
IP privado Caso esteja se conectando a uma réplica usando um endereço IP particular, você não precisará criar mais uma conexão particular da VPC para a réplica, porque ela é herdada da instância principal.
Como restaurar a instância principal Enquanto uma réplica existir, não será possível restaurar a instância principal dela. Antes de restaurar uma instância de um backup ou executar uma recuperação pontual, é necessário promover ou excluir todas as réplicas da instância.
Configurações As configurações da instância principal são propagadas para a réplica, incluindo a senha do usuário do Postgres e as alterações na tabela do usuário.
Como interromper uma réplica Não é possível interromper (stop) uma réplica, apenas instâncias principais. Ela pode ser restart, delete ou disable replication, mas não é possível interromper a réplica como interromper uma instância primária.
Como fazer upgrade de uma réplica É possível que as réplicas de leitura passem por um upgrade que as interrompa a qualquer momento.
Tabelas do usuário Não é possível fazer alterações na réplica. Todas as modificações do usuário precisam ser realizadas na instância primária.

A seguir