A replicação é a capacidade de criar cópias de uma instância do Cloud SQL ou de um banco de dados local e distribuir o trabalho para as cópias.
Introdução
O principal motivo para usar a replicação é a possibilidade de escalonar o uso dos dados em um banco de dados sem prejudicar o desempenho.
Outros motivos incluem:
- migrar dados entre regiões;
- migrar dados entre plataformas;
- migrar dados de um banco de dados local para o Cloud SQL.
Além disso, uma réplica poderá ser promovida se a instância original for corrompida.
Ao se referir a uma instância do Cloud SQL, a instância que é replicada é chamada de instância primária, e as cópias são chamadas de réplicas de leitura. A instância primária e as réplicas de leitura residem no Cloud SQL.
Ao se referir a um banco de dados local, o cenário de replicação é chamado de replicação a partir de um servidor externo. Nesse cenário, o banco de dados que é replicado é o servidor do banco de dados de origem. As cópias que residem no Cloud SQL são chamadas de réplicas do Cloud SQL. Há também uma instância que representa o servidor do banco de dados de origem no Cloud SQL chamada de instância de representação de origem.
Em um cenário de recuperação de desastres, você pode promover uma réplica para a converter em uma instância principal. Dessa forma, é possível usá-la em vez de uma instância que esteja em uma região com uma falha temporária. Também é possível promover uma réplica para substituir uma instância corrompida.
O Cloud SQL é compatível com os seguintes tipos de réplica:
Com a aplicação de conectores, é possível usar apenas o proxy de autenticação do Cloud SQL ou os conectores de linguagem do Cloud SQL para se conectar a instâncias do Cloud SQL. Com a aplicação do conector, o Cloud SQL rejeita conexões diretas ao banco de dados. Não é possível criar réplicas de leitura para uma instância com a aplicação de conector ativada. Da mesma forma, se uma instância tiver réplicas de leitura, não será possível ativar a aplicação do conector nela.
Também é possível usar o Database Migration Service para replicação contínua de um servidor de banco de dados de origem para o Cloud SQL. Observação: o Cloud SQL permite que os usuários gerenciem a própria replicação usando recursos de replicação lógica do PostgreSQL.O Cloud SQL não oferece suporte à replicação entre dois servidores externos.
Réplicas de leitura
Você usará uma réplica de leitura para distribuir o trabalho de uma instância do Cloud SQL. A réplica de leitura é uma cópia exata da instância primária. Os dados e outras alterações na instância primária são atualizados quase em tempo real na réplica de leitura.
As réplicas de leitura são somente para leitura. Portanto, não é possível fazer gravações nelas. A réplica de leitura processa consultas, solicitações de leitura e tráfego de análise, reduzindo a carga na instância primária.
Você se conecta a uma réplica diretamente usando o nome de conexão e o endereço IP dela. Caso esteja se conectando a uma réplica usando um endereço IP particular, você não precisará criar mais uma conexão particular da VPC para a réplica, porque ela é herdada da instância principal.
Para informações sobre como criar uma réplica de leitura, consulte Como criar réplicas de leitura. Para informações sobre como gerenciar uma réplica de leitura, consulte Como gerenciar réplicas de leitura.
Como prática recomendada, coloque réplicas de leitura em uma zona diferente da instância principal quando usar a alta disponibilidade nessa instância. Essa prática garante que as réplicas de leitura continuem a operar quando a zona que contém a instância principal tiver uma interrupção. Consulte a Visão geral da alta disponibilidade para mais informações.
Como selecionar um tipo de máquina apropriado
As réplicas de leitura podem ter um tipo de máquina diferente da principal. É necessário monitorar métricas na instância, como o uso de CPU e memória, para garantir que a instância da réplica esteja dimensionada corretamente para a carga de trabalho, especialmente se ela for menor do que a instância principal. Uma instância de réplica que tiver um tamanho menor é mais propensa a um desempenho ruim, como eventos frequentes de memória insuficiente (OOM, na sigla em inglês).
Impacto na sinalização max_connections
quando a réplica de leitura tem um tipo de máquina com menos memória do que a principal
Em uma instância do PostgreSQL, se a sinalização max_connections
não for definida como um valor de sua escolha, o Cloud SQL a definirá automaticamente com base na
quantidade de memória da instância. Para mais informações, consulte as sinalizações aceitas. O PostgreSQL exige que o
valor de max_connections
seja sempre pelo menos tão grande quanto sua réplica
principal na leitura. Portanto, se uma réplica de leitura tiver menos memória
que a principal e você não tiver definido a sinalização max_connections
, ela
poderá herdar um valor maior de max_connections
com base no tamanho
da instância principal. Nessa situação, se você confiar na
configuração max_connections
para limitar o número de conexões à instância da
réplica, ela poderá ficar sobrecarregada porque o valor é muito alto
em relação ao tipo de máquina de instância. Para evitar que isso aconteça, você
pode fazer o seguinte:
- Redimensione a instância da réplica para um tipo de máquina maior.
- Configure seu aplicativo cliente para limitá-lo a algumas conexões
que sejam menores do que o valor de
max_connections
. - Defina a sinalização
max_connections
na instância principal e a réplica como um valor apropriado.
Operações de índice de hash usando réplicas de leitura
As operações de índice de hash não usam o write-ahead-logging para o PostgreSQL 9.6. O Cloud SQL tem apenas uma versão disponível no PostgreSQL 10. Isso está documentado na caixa de cuidado amarela da página de lançamento do PostgreSQL. Isso também se aplica a réplicas de leitura do Cloud SQL.
Como as atualizações do índice de hash não são propagadas para a réplica de leitura no PostgreSQL 9.6, elas não podem ser usadas pela réplica. Como solução alternativa, você pode não usar réplicas de leitura ou fazer upgrade para uma versão principal do PostgreSQL (10 ou mais recente).
Réplicas de leitura entre regiões
A replicação entre regiões permite criar uma réplica de leitura em uma região diferente da instância primária. Você cria uma réplica de leitura entre regiões da mesma maneira que cria uma réplica na região.
Réplicas entre regiões:
- melhoram o desempenho de leitura disponibilizando réplicas mais próximas da região do aplicativo;
- fornecem capacidade adicional de recuperação de desastres para oferecer proteção contra uma falha regional;
- permitem migrar dados de uma região para outra.
Consulte Como promover réplicas para migração regional ou recuperação de desastres para mais informações sobre réplicas entre regiões.
Réplicas de leitura em cascata
A replicação em cascata permite criar uma réplica de leitura sob outra réplica de leitura na mesma região ou em uma região diferente. Os cenários a seguir são casos de uso de réplicas em cascata:
- Recuperação de desastres: é possível usar uma hierarquia em cascata de réplicas de leitura para simular a topologia da instância principal e das réplicas de leitura. Durante uma falha temporária, sua réplica de leitura selecionada é promovida para primária e as réplicas de leitura sob a nova primária continuam a ser replicadas e estão prontas para uso.
- Melhorias de desempenho: reduza a carga na instância principal descarregando o trabalho de replicação em várias réplicas de leitura.
- Leituras em escala: é possível ter mais réplicas para compartilhar a carga de leitura.
- Redução de custos: é possível reduzir custos de rede usando uma única réplica em cascata com replicação entre regiões em outras regiões.
Terminologia
- Réplica em cascata: uma réplica de leitura que pode ter a própria réplica.
- Níveis: é possível criar níveis de réplicas em uma hierarquia de réplicas em cascata. Por exemplo, se você adicionar quatro réplicas a uma instância, essas quatro réplicas estarão no mesmo nível.
- Instâncias semelhantes: várias réplicas que se replicam da mesma instância principal. As semelhantes estão no mesmo nível na hierarquia de réplicas. Uma réplica pode ter oficialmente até oito semelhantes.
- Réplica de folha: uma réplica de leitura que não tem réplicas próprias. Em uma hierarquia de replicação com vários níveis, a réplica de folha é o último nível.
- Promover: uma ação que converte uma réplica, em qualquer nível na hierarquia, em uma instância principal. Quando promovida, a hierarquia de réplica em cascata da réplica é retida.
Configurar réplicas em cascata
As réplicas em cascata permitem adicionar réplicas de leitura a qualquer réplica atual. É possível adicionar até quatro níveis de réplicas, incluindo a instância principal. Quando você promove a réplica no topo de uma hierarquia de réplicas em cascata, ela se torna uma instância principal e as réplicas em cascata continuam a ser replicadas.
Para planejar sua configuração, é preciso ter uma meta para o que as réplicas de leitura pretendem fazer. As duas seções a seguir descrevem as configurações para recuperação de desastres e replicação multirregional.
Recuperação de desastres
Para entender como as réplicas em cascata ajudam você a se recuperar rapidamente durante uma falha temporária, considere o seguinte cenário de replicação:
Configuração
Falha temporária
Promoção
Se você quiser usar uma instância da Região B em uma configuração de recuperação de desastres e tiver:
- réplicas na mesma região anexada à instância principal (Réplica A)
- réplicas em outras regiões (réplica em cascata) anexadas à primária.
É possível criar réplicas de leitura na réplica em cascata na Região B.
Na guia Falha temporária, se houver uma interrupção na Região A, a réplica em cascata será promovida a uma instância principal. Ela já tem réplicas de leitura abaixo dela, reduzindo o objetivo de tempo de recuperação (RTO, na sigla em inglês).
Na guia Promover, você vê que, quando uma réplica em cascata é promovida, as réplicas dela também são promovidas e continuam a ser replicadas sob ela.
Replicação multirregional
Outro caso de uso de réplicas em cascata é distribuir a capacidade de leitura para uma segunda região de maneira econômica. É possível criar réplicas em C e D em cascata que replicam a partir da réplica B. Os clientes podem distribuir consultas de leitura entre as réplicas B, C e D para reduzir a carga em cada réplica. O custo do tráfego de rede entre regiões é gerado apenas uma vez, desde a instância principal até a réplica B. A replicação de B para C e D usa a transferência de rede dentro da região, que é gratuita.
É possível criar uma hierarquia de até quatro instâncias usando réplicas em cascata para replicação multirregional:
Principal A → Réplica B → Réplica C e Réplica D
Restrições
- Não é possível excluir uma réplica que tenha réplicas sob ela. Para excluir a réplica, comece com as réplicas de folha e siga para cima na hierarquia.
- A dependência de região circular não é compatível. Para ter a réplica de uma réplica em cascata na mesma região da instância principal, a réplica em cascata também precisa estar na mesma região.
Replicação lógica
O Cloud SQL permite configurar as próprias soluções de replicação usando os recursos de replicação lógica do PostgreSQL. A replicação lógica é uma solução flexível que permite:
- Replicação padrão de uma instância principal para uma réplica
- Replicação seletiva de apenas determinadas tabelas ou linhas
- Replicação nas versões principais do PostgreSQL
- Replicação para bancos de dados que não sejam do PostgreSQL
- Fluxos de trabalho de captura de dados de alterações (CDC, na sigla em inglês), em que todas as alterações do banco de dados são transmitidas para um consumidor.
Para mais informações, consulte Como configurar a replicação lógica. Nessa página, há informações sobre:
- Replicação lógica integrada
- Extensão pglogical
Casos de uso da replicação
Os casos de uso a seguir se aplicam a cada tipo de replicação.
Nome | Principal | Réplica | Benefícios e casos de uso | Mais informações |
---|---|---|---|---|
Réplica de leitura | Instância do Cloud SQL | Instância do Cloud SQL |
|
|
Réplica de leitura entre regiões | Instância do Cloud SQL | Instância do Cloud SQL |
|
|
Replicação lógica | Qualquer instância do PostgreSQL | Qualquer instância do PostgreSQL ou um consumidor externo |
|
Faturamento
- Uma réplica de leitura é cobrada segundo a mesma taxa de uma instância padrão do Cloud SQL. Não há cobrança pela replicação de dados.
- O preço de uma réplica de leitura entre regiões é igual ao de criar uma nova instância do Cloud SQL na região. Consulte Preços de instâncias do Cloud SQL e selecione a região apropriada. Além do custo normal associado à instância, uma réplica entre regiões gera cobranças de transferência de dados entre regiões referentes aos registros de replicação enviados da instância primária para a de réplica, conforme descrito em Preços de saída da rede.
Referência rápida para réplicas de leitura do Cloud SQL
Tópico | Discussão |
---|---|
Backups | Você não pode configurar backups na réplica. |
Núcleos e memória | As réplicas de leitura podem usar um número diferente de núcleos e uma quantidade diferentes de memória daqueles da instância primária. |
Como excluir a instância principal | Antes de excluir uma instância principal, você precisa promover todas as réplicas de leitura dela para instâncias independentes ou remover as réplicas. |
Como excluir a réplica | Quando você exclui uma réplica, não há impacto no status da instância principal. |
Como desativar a geração de registros de gravação antecipada | Antes de desativar os registros de gravação antecipada em uma instância principal, é preciso promover ou excluir todas as réplicas de leitura dela. |
Failover | Uma instância principal pode fazer o failover para uma réplica somente se a réplica for uma réplica de DR. As réplicas de leitura não podem fazer failover de forma alguma durante uma interrupção. |
Alta disponibilidade | As réplicas de leitura permitem que você ative a alta disponibilidade nas réplicas. |
Balanceamento de carga | O Cloud SQL não fornece balanceamento de carga entre réplicas. É possível implementar o balanceamento de carga na instância do Cloud SQL. Também é possível usar o pool de conexão para distribuir consultas entre as réplicas com a configuração de balanceamento de carga para ter melhor desempenho. |
Janelas de manutenção | No entanto, as réplicas de leitura compartilham janelas de manutenção com a instância principal. As réplicas seguem as configurações de manutenção da instância principal, incluindo a janela de manutenção, a reprogramação e o período de negação de manutenção. Durante a manutenção, o Cloud SQL atualiza todas as réplicas de leitura antes de atualizar a instância principal. |
Várias réplicas de leitura | O Cloud SQL tem suporte a réplicas em cascata. Como resultado, é possível criar até 10 réplicas para uma única instância principal e criar réplicas dessas réplicas, até quatro níveis, incluindo a instância principal. |
IP particular | Caso esteja se conectando a uma réplica usando um endereço IP particular, você não precisará criar mais uma conexão particular da VPC para a réplica, porque ela é herdada da instância principal. |
Como restaurar a instância principal | Enquanto uma réplica existir, não será possível restaurar a instância principal dela. Antes de restaurar uma instância de um backup ou executar uma recuperação pontual, é necessário promover ou excluir todas as réplicas da instância. |
Configurações | As configurações da instância principal são propagadas para a réplica, incluindo a senha do usuário do Postgres e as alterações na tabela do usuário. |
Como interromper uma réplica | Não é possível interromper (stop ) uma réplica, apenas instâncias principais. Ela pode
ser restart , delete ou disable replication , mas
não é possível interromper a réplica como interromper uma instância primária. |
Como fazer upgrade de uma réplica | É possível que as réplicas de leitura passem por um upgrade que as interrompa a qualquer momento. |
Tabelas do usuário | Não é possível fazer alterações na réplica. Todas as modificações do usuário precisam ser realizadas na instância primária. |
A seguir
- Saiba como criar uma réplica de leitura.
- Saiba como configurar uma instância para alta disponibilidade.