Failovers

Se um cluster do Cloud Bigtable parar de responder, a replicação possibilitará o failover do tráfego de entrada para outro cluster na mesma instância. Os failovers podem ser manuais ou automáticos, dependendo do perfil de app usado por um aplicativo e de como esse perfil está configurado.

Nesta página, explicamos como funcionam os failovers manuais e automáticos em uma instância que usa replicação. Para saber como concluir um failover, consulte Como gerenciar failovers.

Antes de ler esta página, familiarize-se com a visão geral da replicação do Cloud Bigtable.

Failovers manuais

Se um perfil de aplicativo usa roteamento de cluster único para direcionar todos os pedidos a um cluster, você precisa usar o bom senso para decidir quando começar o failover para um cluster diferente.

Aqui estão alguns sinais que podem indicar que seria útil fazer failover para um cluster diferente:

  • O cluster começa a retornar um grande número de erros de sistema temporários.
  • Um grande número de solicitações começa a expirar.
  • A latência média de resposta aumenta até um nível inaceitável.

Esses sinais podem ser exibidos por motivos diferentes, por isso não há garantia de solução do problema de base no caso de um failover para um cluster diferente. Monitore a instância antes e depois do failover para verificar se houve melhora nas métricas.

Para detalhes sobre como concluir um failover manual, consulte Como concluir um failover manual.

Failovers automáticos

Se um perfil de aplicativo usa roteamento de vários clusters, o Cloud Bigtable gerencia failovers automaticamente. Quando o cluster mais próximo não consegue processar uma solicitação, o Cloud Bigtable roteia o tráfego para outro cluster mais próximo disponível.

Os failovers automáticos poderão ocorrer mesmo se um cluster estiver indisponível por um curto período. Por exemplo, se o Cloud Bigtable rotear uma solicitação para um cluster e ele demorar muito para responder ou para retornar um erro transitório, o Cloud Bigtable enviará essa solicitação a outro cluster.

Se você estiver usando roteamento de vários clusters e enviar um pedido com um prazo de solicitação, o Cloud Bigtable fará o failover automaticamente para outro cluster no decorrer do prazo. Por exemplo, se um pedido for enviado com um prazo de dois segundos e tiver passado um segundo sem resposta, o pedido será automaticamente redirecionado para o cluster mais próximo.

Se você estiver usando replicação com roteamento de vários clusters para conseguir alta disponibilidade para seu aplicativo, localize seus clientes servidores ou VMs perto ou em mais de uma região do Google Cloud. Essa recomendação se aplica mesmo que seu servidor de aplicativos não seja hospedado pelo Google Cloud, porque os dados entram na rede do Google Cloud por meio da região do Google Cloud, mais próxima do seu servidor de aplicativos. Como qualquer pedido, um failover é concluído mais rapidamente em distâncias mais curtas.

Muitos failovers automáticos são tão rápidos que nem são percebidos. É possível verificar o gráfico Failovers automáticos no Console do Cloud para ver o número de solicitações que foram reencaminhadas automaticamente durante um período determinado. Abra a lista de instâncias, clique no nome da instância e depois em Monitoramento.

A seguir