Como escalonar e balancear a carga

O Google Cloud Platform (GCP) oferece balanceamento de carga e escalonamento automático para grupos de instâncias.

Balanceamento de carga

O GCP oferece balanceamento de carga no lado do servidor para que você possa distribuir o tráfego de entrada em várias instâncias da máquina virtual. Com o balanceamento de carga, é possível:

  • escalonar seu aplicativo;
  • aceitar tráfego pesado;
  • detectar e remover automaticamente instâncias de máquina virtual não íntegras usando verificações de integridade. Instâncias que se tornam íntegras novamente são automaticamente readicionadas;
  • encaminhar tráfego para a máquina virtual mais próxima.

O balanceamento de carga do GCP usa recursos de regras de encaminhamento para corresponder certos tipos de tráfego e encaminhá-los a um balanceador de carga. Por exemplo, uma regra de encaminhamento pode corresponder tráfego TCP destinado à porta 80 no endereço IP 192.0.2.1 e, em seguida, encaminhá-lo a um balanceador de carga, que o direciona para instâncias de máquina virtual íntegras.

O balanceamento de carga do GCP é um serviço gerenciado, o que significa que os componentes dele são redundantes e altamente disponíveis. Se um componente do balanceamento de carga falhar, ele será reiniciado ou substituído de maneira automática e imediata.

O GCP oferece diversos tipos de balanceamento de carga que diferem em capacidades, cenários de uso e como você os configura. Consulte Balanceamento de carga para ver descrições.

Escalonamento automático

O Compute Engine oferece escalonamento automático para adicionar ou remover automaticamente máquinas virtuais de um grupo de instâncias com base em aumentos ou reduções de carga. Isso ajuda os aplicativos a lidar de forma discreta com aumentos de tráfego e reduz o custo quando a necessidade de recursos é menor. Para isso, basta definir a política de escalonamento automático. O autoescalador realizará o escalonamento automático com base na carga medida.

Políticas

Escolha dentre uma variedade de políticas que um autoescalador pode usar para escalonar as máquinas virtuais. Você precisa especificar pelo menos uma política ao criar um autoescalador. Se você usar várias políticas, o autoescalador dimensionará um grupo de instâncias com base na política que fornece o maior número de máquinas virtuais no grupo.

Nas seções a seguir, há uma visão geral sobre as políticas de escalonamento automático. Para mais informações sobre como configurar uma política de escalonamento automático específica, consulte a respectiva documentação de política.

Utilização da CPU

A utilização da CPU é o escalonamento automático mais básico que pode ser realizado. Esta política diz ao autoescalador para observar a utilização da CPU de um grupo de máquinas virtuais e adicionar ou remover máquinas desse grupo para manter o uso desejado. Isso é útil para configurações que usam muita CPU, mas cujo uso de CPU pode flutuar.

Para mais informações, consulte Escalonamento baseado na utilização de CPU.

Capacidade de disponibilização de balanceamento de carga

Configure um autoescalador para fazer o escalonamento com base na capacidade de disponibilização do balanceamento de carga. Ele observará essa capacidade relativa a um grupo de instâncias e fará o escalonamento se as máquinas virtuais estiverem acima ou abaixo da capacidade.

A capacidade de disponibilização de uma instância pode ser definida no serviço de back-end do balanceador de carga e pode ser baseada em utilização ou solicitações por segundo.

Para ver mais informações, consulte Escalonamento baseado em balanceamento de carga de HTTP(S).

Métricas do Stackdriver Monitoring

Se você exportar ou usar métricas do Stackdriver Monitoring, poderá configurar o escalonamento automático para coletar dados de uma métrica específica e realizar o escalonamento com base no nível de utilização desejado. É possível escalonar com base em métricas padrão fornecidas pelo Stackdriver Monitoring ou usando qualquer métrica personalizada que você criar.

Para ver mais informações, consulte Escalonamento com base em métricas do Stackdriver Monitoring.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Compute Engine