Como escalonar e balancear carga


O Google Cloud oferece balanceamento de carga e escalonamento automático para grupos de instâncias.

Balanceamento de carga

O Google Cloud oferece balanceamento de carga do servidor para que seja possível distribuir o tráfego de entrada em várias instâncias de máquina virtual (VM, na sigla em inglês). Com o balanceamento de carga, é possível:

  • oferecer escalabilidade para seu aplicativo;
  • aceitar tráfego pesado;
  • detectar e remover automaticamente instâncias não íntegras da VM usando verificações de integridade. Instâncias que se tornam íntegras novamente são automaticamente readicionadas;
  • encaminhar tráfego para a máquina virtual mais próxima.

O balanceamento de carga do Google Cloud usa recursos de regra de encaminhamento para corresponder a determinados tipos de tráfego e encaminhá-los para um balanceador de carga. Por exemplo, uma regra de encaminhamento pode corresponder ao tráfego TCP destinado à porta 80 no endereço IP 192.0.2.1, em seguida, encaminhá-lo para um balanceador de carga, que o direciona para instâncias de VM íntegras.

O balanceamento de carga do Google Cloud é um serviço gerenciado, o que significa que seus componentes são redundantes e altamente disponíveis. Se um componente do balanceamento de carga falhar, ele será reiniciado ou substituído de forma automática e imediata.

O Google Cloud oferece vários tipos diferentes de balanceamento de carga que se diferem em funcionalidades, cenários de uso e configuração. Consulte a documentação do balanceamento de carga do Google Cloud para descrições.

Escalonamento automático

O Compute Engine oferece escalonamento automático para adicionar ou remover instâncias de VM de um grupo de instâncias gerenciadas (MIG) com base em aumentos ou reduções na carga. Com o escalonamento automático, seus aplicativos lidam com o aumento do tráfego e reduzem o custo quando a necessidade de recursos é menor. É possível fazer o escalonamento automático de um MIG com base na utilização da CPU, nas métricas do Cloud Monitoring, nas programações ou na capacidade de serviço do balanceamento de carga.

Quando você configura um autoescalonador para dimensionar com base na capacidade de serviço de balanceamento de carga, ele observa a capacidade de exibição de um grupo de instâncias, e dimensiona quando as instâncias da VM estão acima ou abaixo da capacidade. A capacidade de disponibilização de uma instância pode ser definida no serviço de back-end do balanceador de carga e pode ser baseada em utilização ou solicitações por segundo. Para mais informações, consulte Como fazer o escalonamento com base na capacidade de exibição do balanceamento de carga.

Para saber mais sobre escalonamento automático, consulte Escalonamento automático de grupos de instâncias.

A seguir