Como usar o escalonamento automático para aplicativos altamente escalonáveis

Veja neste tutorial como usar o escalonamento automático para ajustar automaticamente o número de instâncias de VM que hospedam seu aplicativo, permitindo que ele se adapte a quantidades variáveis de tráfego.

Para usar o escalonamento automático, hospede seu aplicativo em um grupo de instâncias gerenciadas. Um grupo de instâncias gerenciadas é uma coleção de instâncias que executam o mesmo aplicativo e podem ser gerenciadas como uma única entidade. Quando um grupo de instâncias gerenciadas tem o escalonamento automático ativado, o número de VMs no grupo aumenta (escalonamento horizontal) ou diminui automaticamente (escalonamento vertical) de acordo com o valor máximo especificado para a política de escalonamento automático.

Este tutorial inclui etapas detalhadas para lançar um aplicativo da Web em um grupo de instâncias gerenciadas, configurar o escalonamento automático e o acesso à rede e observar o escalonamento automático simulando picos e quedas de carga. Dependendo da sua experiência com esses recursos, a conclusão deste tutorial leva cerca de 20 minutos.

Objetivos

Lançar um aplicativo de demonstração da Web em um grupo de instâncias gerenciadas.
Observar os efeitos do escalonamento automático simulando picos e quedas de tráfego.

Custos

Neste documento, você usará os seguintes componentes faturáveis do Google Cloud:

Compute Engine

Para gerar uma estimativa de custo baseada na projeção de uso deste tutorial, use a calculadora de preços. Novos usuários do Google Cloud podem estar qualificados para uma avaliação gratuita.

Antes de começar

Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.

No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

Acessar o seletor de projetos

Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

Acessar o seletor de projetos

Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

Arquitetura do aplicativo

O aplicativo inclui os seguintes componentes do Compute Engine:

Regra de firewall: um firewall do Google Cloud que permite autorizar ou negar o tráfego para suas instâncias.
Modelo de instância: um modelo usado para criar cada instância de VM no grupo de instâncias gerenciadas.
Grupo regional de instâncias gerenciadas: um grupo de instâncias de VM que executam o mesmo aplicativo em várias zonas.

Como lançar o aplicativo da Web

Neste tutorial, é usado um aplicativo da Web armazenado no GitHub. Para saber mais sobre como o aplicativo foi implementado, consulte o repositório GoogleCloudPlatform/python-docs-samples no GitHub.

Inclua um script de inicialização em um modelo de instância para lançar o aplicativo da Web em todas as VMs em um grupo de instâncias gerenciadas. Para permitir o tráfego HTTP para o aplicativo da Web, crie uma regra de firewall.

Criar uma regra de firewall

Crie uma regra de firewall que permita o tráfego HTTP para o aplicativo da Web:

No Console do Google Cloud, acesse a página Firewalls.

Acessar Firewalls
Clique em Create firewall rule.
Em Nome, insira default-allow-http.
Defina Rede como default.
Defina Destinos para selecionar Specified target tags.
Em Tags de destino, insira http-server.
Defina Filtro de origem como IP ranges.
Em Intervalos de IP de origem, insira 0.0.0.0/0.

para permitir o acesso a todos os endereços IP.
Em Portas e protocolos, selecione Protocolos e portas especificados. Em seguida, selecione tcp e insira 80 para permitir acesso ao tráfego HTTP.
Clique em Criar.

Criar um modelo de instância

Crie um modelo de instância que lance o aplicativo de demonstração da Web na inicialização:

No Console do Google Cloud, acesse a página Modelos de instância.

Acesse "Modelos de instância"
Clique em Criar modelo de instância.
Em Nome, insira autoscaling-web-app-template.
Em Configuração da máquina, defina Tipo de máquina como e2-standard-2.
Em Firewall, marque a caixa de seleção Permitir tráfego HTTP. Isso aplica a tag de rede http-server a cada instância criada com base nesse modelo.
Clique em Rede, discos, segurança, gerenciamento, locatário único para ver as configurações avançadas.

Na guia Gerenciamento, localize Automação e insira o seguinte script de inicialização:

sudo apt update && sudo apt -y install git gunicorn3 python3-pip
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
cd python-docs-samples/compute/managed-instances/demo
sudo pip3 install -r requirements.txt
sudo gunicorn3 --bind 0.0.0.0:80 app:app --daemon

Com esse script, todas as instâncias executam o aplicativo da Web durante a inicialização.

Clique em Criar.

Criar um grupo de instâncias gerenciadas

Crie um grupo de instâncias regional para começar a executar o aplicativo da Web:

No Console do Google Cloud, acesse a página Grupos de instâncias.

Acesse grupo de instâncias
Clique em Criar grupo de instâncias para criar um novo grupo.
Selecione Novo grupo gerenciado de instâncias (sem estado).
Em Nome, insira autoscaling-web-app-group.
Em Modelo de instância, selecione autoscaling-web-app-template.
Para Local, selecione Várias zonas.

Dica profissional: para garantir que seu aplicativo esteja disponível durante eventos extremos, como interrupções de zona, o Compute Engine recomenda que você distribua o aplicativo em várias zonas.
Em Região, selecione us-central1.
Em Zonas, selecione as seguintes zonas na lista suspensa:
- us-central1-b
- us-central1-c
- us-central1-f
Configure o escalonamento automático para o grupo de instâncias:
1. Em Modo de escalonamento automático, selecione Ativado: adicionar e remover instâncias para o grupo.
2. Defina o Número mínimo de instâncias como 3.
  
  Dica profissional: ao criar um grupo regional de instâncias gerenciadas com o Compute Engine, é recomendável provisionar instâncias suficientes. Assim, caso todas elas em qualquer zona estejam indisponíveis, as instâncias restantes ainda serão o mínimo necessário. No entanto, provisionar mais instâncias do que você precisa pode resultar em custos extra. Para mais informações, consulte Como selecionar o tamanho do grupo de instâncias para garantir a disponibilidade.
3. Defina Número máximo de instâncias como 6.
4. Defina o Período de inicialização como 120 segundos.
  
  Dica profissional: o Período de inicialização se refere a quantos segundos após a criação de uma instância que o escalonador automático espera antes de usar as informações sobre a instância para tomar decisões de escalonamento. Durante a inicialização de uma VM, o uso da CPU não é confiável para o escalonamento automático. Para impedir que o autoescalador seja dimensionado com base em dados imprecisos, garanta que o Período de inicialização seja maior que o tempo necessário para que a utilização de CPU da sua VM se estabilize inicialmente. Para mais informações, consulte Período de inicialização e Como monitorar gráficos e registros de escalonamento automático.
5. Em Métricas de escalonamento automático, selecione Utilização de CPU como o tipo de métrica. Para saber mais sobre as métricas de escalonamento automático, consulte Política de escalonamento automático.
6. Defina a Utilização da CPU de destino para 60.
7. Clique em Concluído.
Em Recuperação automática, selecione Sem verificação de integridade na lista suspensa Verificação de integridade.
Clique em Criar. Você será redirecionado para a página Grupos de instâncias.

Observação: aguarde alguns minutos até que todas as instâncias do grupo estejam em execução e prontas para exibir o aplicativo da Web.
Verifique se as instâncias estão em execução:
1. Na página Grupos de instâncias no console do Google Cloud, clique em autoscaling-web-app-group para ver as instâncias nesse grupo.
2. Em IP externo, clique em um endereço IP para conectar essa instância. Uma nova guia do navegador será aberta, exibindo o aplicativo de demonstração da Web:
  Observação: se você não conseguir se conectar ao aplicativo da Web após aguardar alguns minutos, verifique o status da instância e as configurações de rede:
  - Verifique se o grupo de instâncias está pronto. Se ocorrer uma falha com um status ERR_CONNECTION_REFUSED no carregamento do aplicativo, aguarde alguns minutos para que o script de inicialização termine a execução.
  - Verifique se Permitir tráfego HTTP está ativado para o modelo de instância do grupo. Em seguida, verifique se a regra de firewall allow-web-app-http foi criada corretamente.
  Quando terminar, feche a guia do navegador com o aplicativo de demonstração da Web.

Como observar o escalonamento automático

Para mais informações sobre comportamentos de escalonamento automático, consulte Noções básicas sobre decisões de escalonamento automático.

Monitorar o escalonamento automático

O grupo de instâncias que você criou usa uma Política de escalonamento automático com base no Uso da CPU. Isso significa que o autoescalador aumenta ou diminui o grupo conforme necessário para manter a utilização de destino da CPU em 60%.

Para monitorar o tamanho e a utilização média da CPU do grupo de instâncias, use os gráficos de escalonamento automático no console do Google Cloud:

Na página Grupos de instâncias de autoscaling-web-app-group, clique na guia Monitoramento.
É possível monitorar o escalonamento automático no gráfico Tamanho do grupo. O gráfico exibe Instâncias, que representam o número de instâncias de VM no grupo ao longo do tempo.
Opcional: para monitorar a capacidade de escalonamento automático em comparação com a utilização, consulte o gráfico de Utilização do escalonador automático (CPU). O gráfico exibe a Utilização, que é o uso total de CPU das instâncias de VM no grupo, e a Capacidade, que é a utilização cumulativa da CPU de destino do grupo (utilização da CPU de destino multiplicada pelo número de instâncias de VM).

O escalonamento automático tenta fazer a Capacidade corresponder à Utilização alterando o número de Instâncias, quando possível.

Mantenha esta janela aberta.

Simular escalonamento horizontal

O escalonamento horizontal ocorre quando a utilização média da CPU do grupo de instâncias é significativamente maior do que o valor de destino. Durante o escalonamento horizontal, o escalonador automático aumenta gradualmente o tamanho do grupo de instâncias até que a utilização da CPU diminua para o valor de utilização da CPU desejado ou até que o tamanho do grupo de instâncias seja igual ao Número máximo de instâncias, definido como 6.

Para acionar o escalonamento horizontal, aumente a utilização da CPU nas suas instâncias:

No Console do Google Cloud, abra o Cloud Shell.

Abra o Cloud Shell

O Cloud Shell é aberto na parte debaixo do console do Google Cloud. A inicialização da sessão pode levar alguns segundos.

Dica profissional:
É possível abrir o Cloud Shell em qualquer página do console do Google Cloud usando o botão Ativar o Cloud Shell, que fica no canto superior direito de todas as páginas do console do Google Cloud.
Crie uma variável bash local para o ID do projeto:
```
export PROJECT_ID=[PROJECT_ID]
```
em que PROJECT_ID é o ID do projeto atual, que é exibido em cada nova linha no Cloud Shell:
```
user@cloudshell:~ ([PROJECT_ID])$
```

Execute o script bash a seguir. Esse script faz com que as instâncias de aplicativos de demonstração da Web tenham uma carga aumentada, o que aumenta a utilização de CPU. Após alguns minutos, a utilização da CPU ultrapassará o valor de destino, fazendo com que o escalonamento automático aumente o tamanho do grupo de instâncias.

export MACHINES=$(gcloud --project=$PROJECT_ID compute instances list --format="csv(name,networkInterfaces[0].accessConfigs[0].natIP)" | grep "autoscaling-web-app-group")
for i in $MACHINES;
do
  NAME=$(echo "$i" | cut -f1 -d,)
  IP=$(echo "$i" | cut -f2 -d,)
  echo "Simulating high load for instance $NAME"
  curl -q -s "http://$IP/startLoad" >/dev/null --retry 2
done

Abra a guia Monitoramento no console do Google Cloud.

Após alguns minutos, a guia Monitoramento exibe que a Utilização da CPU aumentou. Isso aciona o escalonamento automático, que aumenta a Capacidade aumentando o número de instâncias.

Observação: pode ser necessário atualizar a página para ver o gráfico mais recente.

Observe que agora há seis instâncias listadas na guia Visão geral.

Mantenha as duas janelas abertas.

Simular escalonamento vertical

O escalonamento vertical ocorre quando a utilização média da CPU do grupo de instâncias é significativamente menor do que o valor de destino. Durante o escalonamento vertical, o escalonador automático diminui gradualmente o tamanho do grupo de instâncias até que a utilização da CPU aumente para a utilização de CPU desejada ou até que o tamanho do grupo de instâncias seja igual ao Número mínimo de instâncias, definido como 3.

Para acionar o escalonamento vertical, diminua a utilização da CPU nas suas instâncias:

Execute o script bash a seguir. Esse script faz com que as instâncias de aplicativos de demonstração da Web tenham uma carga reduzida, o que diminui a utilização de CPU. Após alguns minutos, a utilização de CPU ficará abaixo do valor de destino, fazendo com que o autoescalador diminua o tamanho do grupo de instâncias.

export MACHINES=$(gcloud --project=$PROJECT_ID compute instances list --format="csv(name,networkInterfaces[0].accessConfigs[0].natIP)" | grep "autoscaling-web-app-group")
for i in $MACHINES;
do
  NAME=$(echo "$i" | cut -f1 -d,)
  IP=$(echo "$i" | cut -f2 -d,)
  echo "Simulating low load for instance $NAME"
  curl -q -s "http://$IP/stopLoad" >/dev/null --retry 2
done

Abra a guia Monitoramento no console do Google Cloud.

Após alguns minutos, a guia Monitoramento mostra que a Utilização da CPU diminuiu. Após o período de estabilização, que verifica se a carga é consistentemente menor, o escalonamento automático diminui a Capacidade diminuindo o número de Instâncias.

Observação: pode ser necessário atualizar a página para ver o gráfico mais recente.

Observe que apenas três instâncias estão listadas na guia Visão geral.

Feche as duas janelas quando terminar.

Limpeza

Depois de concluir o tutorial, você pode limpar os recursos que criou para que eles parem de usar a cota e gerar cobranças. Nas seções a seguir, você aprenderá a excluir e desativar esses recursos.

Se você tiver criado um projeto separado para este tutorial, exclua o projeto inteiro. Se o projeto tiver recursos que você quer manter, exclua apenas os recursos criados neste tutorial.

Como excluir o projeto

Cuidado: excluir um projeto tem os seguintes efeitos:

Tudo no projeto é excluído. Se você tiver usado um projeto existente para as tarefas neste documento, a exclusão dele incluirá a exclusão de quaisquer outros trabalhos feitos no projeto.
Os IDs do projeto personalizados são perdidos. Ao criar o projeto, você pode ter criado um código do projeto personalizado para ser usado no futuro. Para preservar os URLs que usam o ID do projeto, como um URL appspot.com, exclua recursos específicos do projeto, em vez de excluir o projeto inteiro.

Se você planeja passar por várias arquiteturas, tutoriais ou guias de início rápido, a reutilização de projetos pode evitar que você exceda os limites da cota do projeto.

No Console do Google Cloud, acesse a página Gerenciar recursos.
Acessar "Gerenciar recursos"
Na lista de projetos, selecione o projeto que você quer excluir e clique em Excluir .
Na caixa de diálogo, digite o ID do projeto e clique em Encerrar para excluí-lo.

Como excluir recursos específicos

Como excluir o grupo de instâncias

No Console do Google Cloud, acesse a página Grupos de instâncias.
Acesse grupo de instâncias
Selecione a caixa de seleção de seu grupo de instâncias autoscaling-web-app-group.
Para excluir a instância, clique em Excluir.

Como excluir o modelo de instância

No Console do Google Cloud, acesse a página Modelos de instância.

Acesse "Modelos de instância"
Clique na caixa de seleção ao lado de autoscaling-web-app-template.
Clique em Excluir na parte superior da página. Na nova janela, clique em Excluir para confirmar a remoção.

Como excluir a regra de firewall

No Google Cloud Console, acesse a página Regras de firewall.

Acessar as regras de firewall
Clique na caixa de seleção ao lado da regra de firewall denominada default-allow-http.
Clique em Excluir na parte superior da página. Na nova janela, clique em Excluir para confirmar a remoção.

A seguir

Teste outro tutorial:
- Como usar a recuperação automática para aplicativos altamente disponíveis.
- Como usar o balanceamento de carga para aplicativos altamente disponíveis.
Saiba mais sobre os grupos de instâncias gerenciadas.
Saiba mais sobre o escalonamento automático.
Saiba mais sobre como projetar sistemas robustos.
Saiba mais sobre como criar aplicativos da Web escalonáveis e resilientes no Google Cloud.