Como aplicar recomendações de escalonamento para grupos de instâncias gerenciadas

Nesta página, você aprenderá a ver e aplicar recomendações de dimensionamento fornecidas pelo Compute Engine para os grupos de instâncias gerenciadas.

O Compute Engine fornece recomendações de tipo de máquina que ajudam você a otimizar a utilização de recursos dos grupos de instâncias gerenciadas. Use essas recomendações para redimensionar o tipo de máquina das instâncias no grupo e aplicar os recursos de um tipo de máquina de maneira mais eficiente. Essas recomendações são geradas automaticamente com base em métricas do sistema coletadas pelo serviço Google Stackdriver Monitoring. Para conhecer as diferentes opções de dimensionamento disponíveis para instâncias de VMs, leia a documentação Tipos de máquina.

Esse recurso também é conhecido como Recomendações de redimensionamento.

Antes de começar

Restrições

As recomendações estão disponíveis para grupos de instâncias gerenciadas de zona única, sem escalonamento automático e sem balanceamento de carga.

Preços

Durante o Beta, as recomendações de redimensionamento são gratuitas. Porém, o Google poderá cobrar por esse recurso em versões futuras.

Métricas usadas para recomendações de dimensionamento

O Compute Engine monitora a utilização da CPU e da memória de máquinas virtuais em execução e faz recomendações usando os dados dos últimos 8 dias. Para recomendar o melhor tipo de máquina única para todas as instâncias em um grupo de instâncias gerenciadas, o Compute Engine gera uma recomendação de dimensionamento padrão para instâncias individuais e, depois de ajustar os valores atípicos, escolhe um tipo de máquina que não subdimensione uma instância de VM única. No cálculo, as instâncias que não estão em execução não são incluídas, como instâncias de VMs interrompidas ou reiniciadas.

O Compute Engine poderá fazer uma recomendação se:

  • a instância tiver apresentado baixa utilização da CPU na maior parte do tempo. O Compute Engine recomendará um tipo de máquina com menos CPUs virtuais;
  • a instância tiver apresentado alta utilização da CPU na maior parte do tempo. O Compute Engine recomendará um tipo de máquina com mais CPUs virtuais;
  • a instância não tiver usado uma fração grande da memória. O Compute Engine recomendará um tipo de máquina com menos memória;
  • a instância estiver usando ativamente uma fração grande da memória na maior parte do tempo. O Compute Engine recomendará um tipo de máquina com mais memória.

O Compute Engine poderá fazer recomendações para usar um tipo de máquina padrão ou personalizado. Há algumas limitações quanto ao volume de memória e à vCPU disponíveis para uma máquina. Em especial, aumentar um recurso pode exigir a ampliação de outro simultaneamente, de modo a seguir as especificações de um tipo de máquina válido. Além disso, o Compute Engine só recomendará tipos de máquinas disponíveis na zona em que a instância estiver em execução.

Consulte Especificações de tipo de máquina personalizado para ver mais detalhes.

Se a carga de trabalho do grupo de instâncias gerenciadas for muito diferente em instâncias individuais, algumas instâncias poderão ser superdimensionadas para que instâncias totalmente utilizadas tenham recursos suficientes, de acordo com a recomendação. Por exemplo, o Compute Engine poderá fazer a seguinte recomendação para comportar a carga de trabalho da instância 4, mesmo que as instâncias 1, 2, 3 e 5 estejam superdimensionadas e subutilizadas:

Recomendações feitas para um grupo de instâncias gerenciadas

Por esse motivo, as recomendações para o grupo de instâncias gerenciadas funcionam melhor quando as instâncias têm uma carga de trabalho razoavelmente distribuída.

No caso de estimativas de diferença de custos, o custo de um grupo de instâncias se baseia no uso da semana anterior (antes do desconto por uso prolongado) e é estendido por 30 dias. Em seguida, é comparado com o custo mensal do tipo de máquina recomendado (antes do desconto por uso prolongado). Para saber preços e detalhes, leia a Documentação sobre preços.

Cargas de trabalho para recomendações de dimensionamento

Aproveite as recomendações de dimensionamento quando tiver:

  • cargas de trabalho com diminuições e aumentos periódicos no tráfego, como cargas de trabalho suscetíveis a tráfego sazonal;
  • cargas de trabalho que são subutilizadas na CPU e na RAM porque estão restringidas por outras limitações, como capacidade de leitura e gravação;
  • cargas de trabalho com software que exige licenças individuais e que não podem se dar ao luxo de adicionar mais instâncias. Nesse caso, será possível contar com as recomendações de dimensionamento para fazer o escalonamento dos recursos, mantendo constante o número de instâncias de VM;
  • cargas de trabalho que não podem se adaptar dinamicamente a um número variável de instâncias (por exemplo, cargas de trabalho que não são adequadas para escalonamento automático).

Talvez não seja conveniente usar recomendações de dimensionamento se você tiver cargas de trabalho com picos muito limitados. Uma recomendação não seria gerada com rapidez suficiente para ser útil ou você teria grupos de instâncias gerenciadas em que cada instância lida com uma carga de trabalho totalmente diferente, criando recomendações superdimensionadas para a maioria das instâncias de VM no grupo.

Como ver recomendações de dimensionamento

O Compute Engine faz recomendações por meio do Console do Google Cloud Platform. As recomendações permanecem ativadas por padrão, mas, caso você precise ativá-las ou desativá-las, siga estas instruções.

  1. Acesse a página "Grupos de instâncias".

    Acessar a página "Grupos de instâncias"

  2. Selecione o projeto e clique em Continuar.
  3. Observe a coluna Recomendação para avaliar as recomendações de grupos de instâncias gerenciadas individuais. Também classifique a coluna por valor estimado de economia. Se não houver recomendações ao lado dos grupos de instâncias, significa que o Compute Engine não tem recomendações a fazer.

    Coluna de recomendações

  4. Caso seu grupo de instâncias tenha dois modelos de instância, o Compute Engine fornecerá recomendações para cada um deles. Clique em uma recomendação para ver recomendações para o respectivo modelo de instância.

    Recomendações para vários modelos

Quando você cria um novo grupo de instâncias gerenciadas, as recomendações para o novo grupo são exibidas 24 horas após a criação da instância.

Depois disso, as recomendações são atualizadas regularmente durante todo o dia.

Como aplicar recomendações a grupos de instâncias

Se você quiser aplicar as recomendações feitas pelo Compute Engine, redimensione as instâncias do grupo diretamente na tela de recomendações.

Quando você aplicar uma recomendação a um grupo de instâncias gerenciadas, o Compute Engine:

  1. clonará os modelos de instância que estão sendo usados pelo grupo de instâncias gerenciadas;
  2. modificará os modelos de instância clonados com base nas recomendações e em qualquer alteração feita;
  3. usará o Managed Instance Group Updater para aplicar o novo modelo. Se o grupo de instâncias tiver dois modelos de instância:

    1. Só aplique recomendações para um modelo de instância de cada vez.
    2. Um grupo de instâncias gerenciadas poderá manter, no máximo, dois modelos de instância por vez, portanto não será possível implantar a recomendação mantendo dois outros modelos de instância. No entanto, será impossível implantar uma recomendação caso seu grupo de instâncias tenha apenas um modelo.

Para aplicar uma recomendação:

  1. Na página "Grupos de instâncias", clique no texto de recomendação do grupo de instâncias que você quer atualizar.

    Como selecionar uma coluna de recomendações

  2. É exibido um pop-up com mais detalhes e as opções Cancelar, Dispensar recomendação ou Continuar. Para analisar e aplicar a recomendação, clique em Continuar.

  3. A recomendação é explicada em detalhes na tela seguinte. Se você avançar com a recomendação, o Compute Engine criará um novo modelo de instância e atualizará todas as instâncias no grupo para usar o novo modelo.

  4. (Avançado) Se você quiser personalizar como o novo modelo será implantado em suas instâncias, clique em Personalizar implantação. É exibida uma nova tela.

    1. Em Modelo, é possível escolher se o novo modelo precisa ser aplicado a 100% das instâncias no grupo de instâncias ou apenas a um subconjunto delas.
    2. Em "Modo de atualização", escolha se o Compute Engine excluirá e criará ativamente novas instâncias usando o novo modelo de instância (Proativo) ou se o Compute Engine aplicará a atualização somente no caso de a instância ser criada por outros meios, como um redimensionamento ou quando uma nova instância é adicionada ao grupo (Oportunista).
    3. Em Máximo de sobretensão, escolha quantas instâncias temporárias a mais serão criadas acima do tamanho de destino do grupo de instâncias gerenciadas. Quanto mais instâncias você permitir, mais rápida será a atualização, ao custo de instâncias adicionais. O padrão é 1 instância adicional.
    4. Em Máximo indisponível, escolha quantas instâncias de cada vez terão permissão para ficar off-line durante a atualização. Esse número também inclui todas as instâncias que não estão disponíveis por outros motivos. Por exemplo, se o grupo de instâncias estiver em processo de redimensionamento, as instâncias no meio da criação poderão não estar disponíveis. Essas instâncias estariam incluídas nesse número. O padrão é a indisponibilidade de uma instância por vez.
    5. Em Tempo de espera mínimo, escolha quantos segundos quer aguardar antes que uma instância recém-criada seja marcada como atualizada. O tempo começa a ser contado após uma verificação de integridade bem-sucedida. Use este recurso para controlar a taxa em que o modelo de instância é aplicado.
  5. Clique no botão "Salvar" para aplicar as alterações.

  6. Quando estiver pronto, clique em "Implantar" para que as alterações entrem em vigor.

Como dispensar recomendações

Após concluir as ações relacionadas a uma recomendação, você poderá dispensá-la. Isso remove a recomendação da estimativa de economia total e também minimiza o aparecimento da recomendação deixando-a cinza.

Estimativa de economia
Estimativa de economia total

Para dispensar uma única recomendação:

  1. Na página "Grupos de instâncias", clique no texto de recomendação que você quer dispensar.
  2. É exibido um pop-up com mais detalhes, além de um botão Dispensar recomendação.
  3. Clique em Dispensar recomendação.

Para dispensar todas as recomendações, clique no botão "Dispensar todas" na página "Grupos de instâncias".

Dispensar recomendações

Para restaurar uma recomendação:

  1. Na página "Grupos de instâncias", clique no texto de recomendação cinza que você quer restaurar.

    Recomendação dispensada

  2. É exibido um pop-up com mais detalhes, além de um botão Restaurar recomendação.

  3. Clique em Restaurar recomendação.

Como usar o Agente de monitoramento para ter recomendações mais precisas

O Stackdriver oferece um Agente de monitoramento que coleta métricas adicionais de disco, CPU, rede e processos com base nas instâncias das VMs. Você pode instalar o agente de monitoramento nas instâncias das VMs. Dessa maneira, ele pode acessar os recursos do sistema e os serviços de aplicativos para coletar esses dados.

Se o agente de monitoramento estiver instalado e em execução em uma instância da VM, as métricas da CPU e de memória coletadas pelo agente serão usadas automaticamente para calcular as recomendações de dimensionamento. Em comparação com as métricas padrão do Compute Engine, as métricas do agente de monitoramento proporcionam insights melhores sobre a utilização dos recursos da instância. Isso permite que o mecanismo de recomendação faça uma estimativa melhor dos requisitos de recursos e apresente recomendações mais precisas.

Para instalar o agente, consulte Instalação do Agente de monitoramento.

Feedback

Durante a versão Beta, você pode enviar seu feedback por e-mail para o grupo de discussão de recomendações de dimensionamento.

A seguir

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Compute Engine