Esta página foi traduzida pela API Cloud Translation.

Como usar uma política de escalonamento automático com vários sinais

Ao criar uma política de escalonamento automático com vários sinais, o escalonador automático faz o escalonamento com base no sinal que fornece o maior número de instâncias de máquina virtual (VM) no grupo gerenciado de instâncias (MIG). Isso garante que sempre haja VMs suficientes para processar as cargas de trabalho do aplicativo e que você consiga escalonar os aplicativos com vários gargalos possíveis.

Para saber mais sobre os diferentes tipos de sinais de escalonamento automático, consulte Política de escalonamento automático.

Antes de começar

Leia sobre as noções básicas do escalonador automático.
Configure a autenticação, caso ainda não tenha feito isso. Com isso, você confirma sua identidade para acesso a serviços e APIs do Google Cloud . Para executar código ou exemplos em um ambiente de desenvolvimento local, faça a autenticação no Compute Engine com um destes métodos:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:
  gcloud init
  Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.
  
  Observação: se você já instalou a gcloud CLI, execute o comando gcloud components update para verificar se você tem a versão mais recente.
2. Set a default region and zone.
REST

Para usar as amostras da API REST desta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.
Saiba mais em Autenticar para usar REST na documentação de autenticação do Google Cloud .

Como o escalonador automático gerencia vários sinais

Um escalonador automático gerencia vários sinais calculando o número recomendado de VMs para cada sinal e escolhe o sinal que resulta no maior número de VMs no MIG.

Um escalonador automático é capaz de gerenciar um sinal por tipo de métrica, exceto no caso de métricas do Cloud Monitoring e de programações de escalonamento. É possível escolher até cinco sinais de escalonamento automático para as métricas do Cloud Monitoring e criar até 128 programações por MIG. Por exemplo, é possível criar um escalonador automático que use até 1 sinal de utilização de CPU, até 1 sinal de balanceamento de carga, até 5 sinais de métrica personalizados e até 128 programações de escalonamento.

Por exemplo, você pode definir um escalonador automático com todos os sinais a seguir:

cpuUtilization com meta de 0,8
loadBalancingUtilization com meta de 0,6
customMetricUtilization para metric1 com meta de 1.000
customMetricUtilization para metric2 com meta de 2.000
scalingSchedules
- Um mínimo de seis VMs por sábado e domingo às 0h por 24 horas
- um mínimo de 15 VMs de segundas a sextas-feiras às 9h por 8 horas

Neste exemplo, imagine que o escalonador automático mede os seguintes valores médios de utilização para um MIG que contém 10 VMs no momento da medição:

0,5 para utilização da CPU
0,4 para utilização do balanceamento de carga
1.100 para metric1
2.700 para metric2

Usando os valores anteriores, o escalonador automático calcula o número recomendado de VMs com base em cada sinal:

7 VMs baseadas na utilização da CPU
7 VMs baseadas na utilização do balanceamento de carga
11 VMs baseadas em metric1
14 VMs baseadas em metric2
6 VMs por sábado e domingo durante todo o dia com base na primeira programação de escalonamento
15 VMs de segunda a sexta-feira, das 9h às 17h, com base na segunda programação de escalonamento

O escalonador automático escolhe o sinal que resulta no maior número de VMs no MIG e define o tamanho recomendado do MIG para esse valor. Neste caso, o escalonador automático redimensionará o MIG para 15 VMs se a segunda programação estiver ativa naquele momento. Caso contrário, o redimensionamento será para 14 VMs.

Crie um escalonador automático com vários sinais

A criação de um escalonador automático com vários indicadores é um pouco diferente dependendo da ferramenta utilizada: o console Google Cloud , a CLI gcloud ou a REST.

Permissões exigidas para a tarefa

Para executar esta tarefa, é necessário ter permissões:

Para criar um novo escalonador automático para um MIG atual:
- compute.autoscalers.create no projeto
- compute.instanceGroupManagers.use no MIG
Para editar um escalonador automático atual:
- compute.autoscalers.update no projeto

Console

No console Google Cloud , acesse a página Grupos de instâncias.

Acesse grupo de instâncias
Clique no nome de um MIG na lista.
Clique em Editar.
Clique em Tamanho do grupo e escalonamento automático para abrir a seção.
Na lista Modo de escalonamento automático, verifique se a opção Ativado: adicionar e remover instâncias do grupo está selecionada.
No campo Número mínimo de instâncias, insira o número mínimo de VMs desejado para este MIG. O tamanho mínimo desse MIG é sempre mantido, independentemente dos sinais de escalonamento automático.
No campo Número máximo de instâncias, insira o número máximo de VMs desejado para este MIG. O tamanho máximo desse MIG nunca é excedido, independentemente do tamanho recomendado gerado pelos sinais de escalonamento automático.
Para cada sinal de escalonamento automático baseado em métrica que você quiser adicionar, clique em Adicionar um indicador.
- Para criar um indicador de escalonamento automático com base na utilização média da CPU, na lista Tipo de indicador, selecione Utilização da CPU. Em seguida, insira uma utilização de CPU de destino e clique em Concluído. Para mais informações, consulte Como fazer o escalonamento baseado na utilização da CPU.
- Para criar um indicador de escalonamento automático com base na capacidade de exibição do balanceamento de carga HTTP, na lista Tipo de indicador, selecione Utilização de balanceamento de carga HTTP. Em seguida, insira uma Utilização de balanceamento de carga HTTP de destino e clique em Concluído. Para mais informações, consulte Escalonamento com base na capacidade de exibição do balanceamento de carga.
- Para criar um sinal de escalonamento automático com base nas métricas do Cloud Monitoring, na lista Tipo de sinal, selecione Métrica do Cloud Monitoring. Em seguida, preencha os campos restantes e clique em Concluído. Para mais informações, consulte Como escalonar com base nas métricas do Cloud Monitoring.
Para cada sinal de escalonamento automático baseado em programação que você quer adicionar, na seção Programações de escalonamento automático, clique em Gerenciar.
1. Clique em Criar programação.
2. No painel Criar uma programação de escalonamento, preencha os campos necessários e clique em Salvar.
3. No painel Como escalonar programações, clique em Concluído.
Para mais informações, consulte Como escalonar com base em programações.
Na seção Período de inicialização, insira o número de segundos que seu aplicativo precisa para ser inicializado. Esse período permite que as VMs concluam a inicialização antes que o escalonador automático considere os dados de uso confiáveis. Para mais informações, consulte Período de inicialização.
Opcional: para ativar os controles de redução de escalonamento horizontal, na seção Controles de redução de escalonamento horizontal, marque a caixa de seleção Ativar controles de redução de escalonamento horizontal. Para mais informações, consulte controles de redução do escalonamento horizontal.
Clique em Salvar.

gcloud

Para criar um escalonador automático com vários sinais, use o comando set-autoscaling. Transmita várias especificações de sinal usando as respectivas sinalizações de linha de comando.

Por exemplo, o comando a seguir cria um escalonador automático que usa a utilização da CPU, a capacidade de exibição do balanceamento de carga, duas métricas personalizadas e uma programação de escalonamento. As sinalizações --max-num-replicas e --min-num-replicas restringem o tamanho máximo ou mínimo que o MIG pode alcançar.

gcloud compute instance-groups managed set-autoscaling MIG_NAME \
   --target-cpu-utilization=0.8 \
   --target-load-balancing-utilization=0.6 \
   --custom-metric-utilization metric=PATH_TO_CUSTOM_METRIC_1,utilization-target=1000.0,utilization-target-type=GAUGE \
   --custom-metric-utilization metric=PATH_TO_CUSTOM_METRIC_2,utilization-target=2000.0,utilization-target-type=DELTA_PER_SECOND \
   --set-schedule=workday-capacity \
   --schedule-cron="30 8 * * Mon-Fri" \
   --schedule-duration-sec=30600 \
   --schedule-min-required-replicas=10 \
   --schedule-description="Have at least 10 VMs every Monday through Friday from 8:30 AM to 5 PM UTC" \
   --min-num-replicas=1 \
   --max-num-replicas=50

Substitua:

MIG_NAME: o nome de um MIG.
PATH_TO_CUSTOM_METRIC_1 e PATH_TO_CUSTOM_METRIC_2: opcional: os caminhos para as métricas personalizadas com um formato semelhante a custom.cloudmonitoring.googleapis.com/path/to/metric1 e custom.cloudmonitoring.googleapis.com/path/to/metric2. Para mais informações, consulte Métricas personalizadas.

Com exceção das sinalizações de métrica personalizada, você pode transmitir apenas uma sinalização para cada tipo de métrica por comando gcloud. Para métricas personalizadas, é possível fornecer várias métricas personalizadas em um único comando repetindo a sinalização --custom-metric-utilization.

Para mais informações sobre como configurar as sinalizações para cada tipo de sinal de escalonamento automático, consulte as seguintes páginas:

REST

Para criar um escalonador automático, use o método autoscalers.insert para um MIG zonal ou o método regionAutoscalers.insert para um MIG regional.

Por exemplo, a solicitação a seguir cria um escalonador automático que usa a utilização da CPU, a capacidade de exibição do balanceamento de carga, duas métricas personalizadas e duas programações de escalonamento. Os campos maxNumReplicas e minNumReplicas restringem o tamanho máximo ou mínimo que o MIG pode alcançar.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT/zones/ZONE/autoscalers

{
  "autoscalingPolicy" : {
    "cpuUtilization":{
      "utilizationTarget": 0.8
    },
    "loadBalancingUtilization":{
      "utilizationTarget": 0.6
    },
    "customMetricUtilizations":[
      {
        "metric": "PATH_TO_CUSTOM_METRIC_1",
        "utilizationTarget": 1000,
        "utilizationTargetType":"GAUGE"
      },
      {
        "metric": "PATH_TO_CUSTOM_METRIC_2",
        "utilizationTarget": 2000,
        "utilizationTargetType": "DELTA_PER_SECOND"
      }
    ],
    "scalingSchedules": {
      "workday-capacity": {
        "minRequiredReplicas": 10,
        "schedule": "30 8 * * Mon-Fri",
        "durationSec": 30600,
        "description": "Have at least 10 VMs every Monday through Friday from 8:30 AM to 5 PM UTC"
      },
      "january-30-2030-schedule": {
        "minRequiredReplicas": 30,
        "schedule": "0 0 30 1 * 2030",
        "timeZone": "America/New_York",
        "durationSec": 86400,
        "description": "Schedule a minimum of 30 VMs all day for January 30, 2030"
      }
    },
    "maxNumReplicas": 50,
    "minNumReplicas": 1
  },
  "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-a/instanceGroupManagers/MIG_NAME",
  "name": "MIG_NAME"
}

Substitua:

PROJECT: o ID do projeto;
ZONE: a zona em que o MIG está localizado;
MIG_NAME: o nome de um MIG.
PATH_TO_CUSTOM_METRIC_1 e PATH_TO_CUSTOM_METRIC_2: opcional: os caminhos para as métricas personalizadas com um formato semelhante a custom.cloudmonitoring.googleapis.com/path/to/metric1 e custom.cloudmonitoring.googleapis.com/path/to/metric2. Para mais informações, consulte Métricas personalizadas.

Como mostrado neste exemplo, é possível fornecer várias métricas personalizadas e programações de escalonamento na mesma solicitação.

Para mais informações sobre como configurar os campos de cada tipo de sinal de escalonamento automático, consulte as seguintes páginas: