Como escalonar e balancear carga

O Google Cloud Platform (GCP) oferece balanceamento de carga e escalonamento automático para grupos de instâncias.

Balanceamento de carga

O GCP oferece balanceamento de carga do servidor para que você possa distribuir o tráfego de entrada em várias instâncias de máquina virtual. Com o balanceamento de carga, é possível:

  • oferecer escalabilidade para seu aplicativo;
  • aceitar tráfego pesado;
  • detectar e remover automaticamente instâncias não íntegras da VM usando verificações de integridade. Instâncias que se tornam íntegras novamente são automaticamente readicionadas;
  • encaminhar tráfego para a máquina virtual mais próxima.

O balanceamento de carga do GCP usa recursos de regras de encaminhamento para corresponder certos tipos de tráfego e encaminhá-los a um balanceador de carga. Por exemplo, uma regra de encaminhamento pode corresponder ao tráfego TCP destinado à porta 80 no endereço IP 192.0.2.1, em seguida, encaminhá-lo para um balanceador de carga, que o direciona para instâncias de VM íntegras.

O balanceamento de carga do GCP é um serviço gerenciado, o que significa que os componentes dele são redundantes e altamente disponíveis. Se um componente do balanceamento de carga falhar, ele será reiniciado ou substituído de forma automática e imediata.

O GCP oferece diversos tipos de balanceamento de carga que diferem em capacidades, cenários de uso e como você os configura. Consulte a documentação do balanceamento de carga do Google Cloud para ver descrições.

Escalonamento automático

O Compute Engine oferece escalonamento automático para adicionar ou remover automaticamente máquinas virtuais de um grupo de instâncias com base em aumentos ou reduções de carga. Com o escalonamento automático, seus aplicativos lidam com o aumento do tráfego e reduzem o custo quando a necessidade de recursos é menor. Depois de definir a política de escalonamento automático, o autoescalador executa o processo com base na carga medida.

Políticas

Ao criar um autoescalador, especifique pelo menos uma política de escalonamento automático. Escolha uma política com base na utilização da CPU, na capacidade de veiculação do balanceamento de carga ou nas métricas do Stackdriver Monitoring. Se você usar várias políticas, o autoescalonador dimensiona um grupo de instâncias com base na política que fornece o maior número de instâncias de VM no grupo.

As seções a seguir discutem as políticas de escalonamento automático em geral. Para mais informações sobre como configurar uma política específica de escalonamento automático, consulte a respectiva documentação da política.

Uso da CPU

A utilização da CPU é o escalonamento automático mais básico que pode ser realizado. Esta política diz ao autoescalador para observar a utilização média da CPU de um grupo de instâncias de VM e adicionar ou remover instâncias do grupo para manter a utilização que você quer. Isso é útil para configurações que exigem muita CPU, mas que podem variar no uso dela.

Para mais informações, consulte Escalonamento baseado na utilização de CPU.

Capacidade de disponibilização de balanceamento de carga

Quando você configura um autoescalonador para dimensionar com base na capacidade de serviço de balanceamento de carga, ele observa a capacidade de exibição de um grupo de instâncias, e dimensiona quando as instâncias da VM estão acima ou abaixo da capacidade.

A capacidade de atendimento de uma instância pode ser definida no serviço de back-end do balanceador de carga e pode ser baseada em utilização ou solicitações por segundo.

Para mais informações, consulte Escalonamento baseado na capacidade de veiculação do balanceamento de carga HTTP(S).

Métricas de monitoramento

Se você exportar ou usar métricas do Stackdriver Monitoring, poderá configurar o escalonamento automático para coletar dados de uma métrica específica e realizar o escalonamento com base no nível de utilização que você quer. É possível fazer o escalonamento com base em métricas padrão fornecidas pelo Monitoring ou usando qualquer métrica personalizada que você criar.

Para mais informações, consulte Escalonamento com base nas métricas de monitoramento.

A seguir

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Compute Engine