Esta página foi traduzida pela API Cloud Translation.

Como configurar o escalonamento automático horizontal de pods

Autopilot Standard

Nesta página, mostramos como escalonar suas implantações no Google Kubernetes Engine (GKE) ajustando automaticamente seus recursos usando métricas como alocação de recursos, tráfego do balanceador de carga, métricas personalizadas ou várias métricas simultaneamente. Esta página também fornece instruções detalhadas para configurar um perfil de escalonador automático horizontal de pods (HPA), incluindo como visualizar, excluir, limpar e resolver problemas do objeto HPA. Uma implantação é um objeto da API Kubernetes que permite executar várias réplicas de pods distribuídos entre os nós de um cluster.

Esta página é destinada a operadores e desenvolvedores que gerenciam o escalonamento de aplicativos no GKE e querem entender como otimizar dinamicamente a performance e manter a eficiência de custos com o escalonamento automático horizontal de pods. Para saber mais sobre papéis comuns e tarefas de exemplo referenciados no conteúdo do Google Cloud, consulte Tarefas e funções de usuário comuns do GKE.

Antes de começar

Antes de começar, verifique se você realizou as tarefas a seguir:

Ativar a API Google Kubernetes Engine.

Ativar a API Google Kubernetes Engine

Se você quiser usar a CLI do Google Cloud para essa tarefa, instale e inicialize a gcloud CLI. Se você instalou a CLI gcloud anteriormente, instale a versão mais recente executando o comando gcloud components update. Talvez as versões anteriores da CLI gcloud não sejam compatíveis com a execução dos comandos neste documento.
Observação: em instalações prévias da gcloud CLI, defina a propriedade compute/region. Se você usa principalmente clusters zonais, defina compute/zone. Ao definir um local padrão, é possível evitar erros na gcloud CLI como: One of [--zone, --region] must be supplied: Please specify location. Talvez seja necessário especificar o local em determinados comandos se o local do cluster for diferente do padrão definido.

Verifique se você tem um cluster do Autopilot ou Standard. Se precisar de um, crie um cluster do Autopilot.

Versões da API para objetos `HorizontalPodAutoscaler`

Quando você usa o console do Google Cloud , os objetos HorizontalPodAutoscaler são criados usando a API autoscaling/v2.

Quando você usa kubectl para criar ou visualizar informações sobre um escalonador automático horizontal de pods, é possível especificar a API autoscaling/v1 ou autoscaling/v2.

apiVersion: autoscaling/v1 é o padrão e permite fazer o escalonamento automático com base apenas na utilização da CPU. Para fazer o escalonamento automático com base em outras métricas, o uso de apiVersion: autoscaling/v2 é recomendado. O exemplo em Criar a implantação de exemplo usa apiVersion: autoscaling/v1.
Recomenda-se usar apiVersion: autoscaling/v2 para criar novos objetos HorizontalPodAutoscaler. Isso permite fazer o escalonamento automático com base em várias métricas, incluindo métricas personalizadas ou externas. Todos os outros exemplos nesta página usam apiVersion: autoscaling/v2.

Para verificar quais versões da API são compatíveis, use o comando kubectl api-versions.

É possível especificar qual API será usada quando você visualizar detalhes sobre um escalonador automático horizontal de pods que usa apiVersion: autoscaling/v2.

Crie a implantação de exemplo

Antes de criar um escalonador automático horizontal de pods, crie a carga de trabalho que ele monitora. Os exemplos nesta página aplicam configurações diferentes do Escalonador automático horizontal de pods à implantação nginx a seguir. Outros exemplos mostram um escalonador automático horizontal de pods com base na utilização de recursos, na métrica personalizada ou externa e em várias métricas.

Salve o seguinte em um arquivo chamado nginx.yaml:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx
  namespace: default
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80
        resources:
          # You must specify requests for CPU to autoscale
          # based on CPU utilization
          requests:
            cpu: "250m"

Este manifesto especifica um valor para solicitações de CPU. Se desejar fazer escalonamento automático com base na utilização de um recurso, como uma porcentagem, especifique solicitações para esse recurso. Se você não especificar solicitações, será possível fazer escalonamento automático com base apenas no valor absoluto da utilização do recurso, como milliCPUs para a utilização da CPU.

Para criar a implantação, aplique o manifesto nginx.yaml:

kubectl apply -f nginx.yaml

A implantação tem spec.replicas definido como 3, então três pods são implantados. É possível verificar isso usando o comando kubectl get deployment nginx.

Cada um dos exemplos nesta página aplica um Escalonador automático horizontal de pods a um exemplo de implantação nginx.

Escalonamento automático com base na utilização de recursos

Este exemplo cria um objeto HorizontalPodAutoscaler para escalonamento automático da implantação nginx quando a utilização da CPU ultrapassar 50% e garante que sempre haja, no mínimo, uma réplica e, no máximo, dez réplicas.

É possível criar um escalonador automático horizontal de pods que segmente a CPU usando o console Google Cloud , o comando kubectl apply ou, somente para uma média da CPU, o comando kubectl autoscale.

Console

Acesse a página Cargas de trabalho no console Google Cloud .

Acesse "Cargas de trabalho"
Clique no nome da implantação nginx.
Clique em Ações > Escalonamento automático.
Especifique os seguintes valores:
- Número mínimo de réplicas: 1
- Número máximo de réplicas: 10
- Métrica de escalonamento automático: CPU
- Destino: 50
- Unidade: %
Clique em Concluído.
Clique em Escalonamento automático.

`kubectl apply`

Salve o seguinte manifesto YAML como um arquivo chamado nginx-hpa.yaml:

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: nginx
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx
  # Set the minimum and maximum number of replicas the Deployment can scale to.
  minReplicas: 1
  maxReplicas: 10
  # The target average CPU utilization percentage across all Pods.
  targetCPUUtilizationPercentage: 50

Para criar o HPA, aplique o manifesto usando o seguinte comando:

kubectl apply -f nginx-hpa.yaml

`kubectl autoscale`

Para criar um objeto HorizontalPodAutoscaler que segmenta somente a utilização média da CPU, é possível usar o comando kubectl autoscale:

kubectl autoscale deployment nginx --cpu-percent=50 --min=1 --max=10

Para ver uma lista de escalonadores automáticos de pods horizontal no cluster, use o seguinte comando:

kubectl get hpa

O resultado será assim:

NAME    REFERENCE          TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
nginx   Deployment/nginx   0%/50%    1         10        3          61s

Para detalhes sobre o escalonador automático horizontal de pods, use o console Google Cloud ou o comando kubectl.

Console

Acesse a página Cargas de trabalho no console Google Cloud .

Acesse "Cargas de trabalho"
Clique no nome da implantação nginx.
Veja a configuração do escalonador automático horizontal de pods na seção Autoescalador.
Veja mais detalhes sobre eventos de escalonamento automático na guia Eventos.

`kubectl get`

Para mais detalhes sobre o escalonador automático horizontal de pods, use kubectl get hpa com a sinalização -o yaml. O campo status contém informações sobre o número atual de réplicas e todos os eventos recentes de escalonamento automático.

kubectl get hpa nginx -o yaml

O resultado será assim:

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  annotations:
    autoscaling.alpha.kubernetes.io/conditions: '[{"type":"AbleToScale","status":"True","lastTransitionTime":"2019-10-30T19:42:59Z","reason":"ScaleDownStabilized","message":"recent
      recommendations were higher than current one, applying the highest recent recommendation"},{"type":"ScalingActive","status":"True","lastTransitionTime":"2019-10-30T19:42:59Z","reason":"ValidMetricFound","message":"the
      HPA was able to successfully calculate a replica count from cpu resource utilization
      (percentage of request)"},{"type":"ScalingLimited","status":"False","lastTransitionTime":"2019-10-30T19:42:59Z","reason":"DesiredWithinRange","message":"the
      desired count is within the acceptable range"}]'
    autoscaling.alpha.kubernetes.io/current-metrics: '[{"type":"Resource","resource":{"name":"cpu","currentAverageUtilization":0,"currentAverageValue":"0"}}]'
    kubectl.kubernetes.io/last-applied-configuration: |
      {"apiVersion":"autoscaling/v1","kind":"HorizontalPodAutoscaler","metadata":{"annotations":{},"name":"nginx","namespace":"default"},"spec":{"maxReplicas":10,"minReplicas":1,"scaleTargetRef":{"apiVersion":"apps/v1","kind":"Deployment","name":"nginx"},"targetCPUUtilizationPercentage":50}}
  creationTimestamp: "2019-10-30T19:42:43Z"
  name: nginx
  namespace: default
  resourceVersion: "220050"
  selfLink: /apis/autoscaling/v1/namespaces/default/horizontalpodautoscalers/nginx
  uid: 70d1067d-fb4d-11e9-8b2a-42010a8e013f
spec:
  maxReplicas: 10
  minReplicas: 1
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx
  targetCPUUtilizationPercentage: 50
status:
  currentCPUUtilizationPercentage: 0
  currentReplicas: 3
  desiredReplicas: 3

Antes de seguir os outros exemplos desta página, exclua o HPA:

kubectl delete hpa nginx

Quando você exclui um escalonador automático horizontal de pods, o número de réplicas da implantação permanece o mesmo. Uma implantação não volta automaticamente ao estado anterior à aplicação do escalonador automático do pod horizontal.

Saiba mais sobre como excluir um escalonador automático horizontal de pods.

Como fazer escalonamento automático com base no tráfego do balanceador de carga

O escalonamento automático baseado em tráfego é um recurso do GKE que integra sinais de utilização de tráfego de balanceadores de carga para escalonar automaticamente os pods.

Usar o tráfego como um sinal de escalonamento automático pode ser útil, porque o tráfego é um indicador principal de carga que é complementar à CPU e à memória. A integração incorporada no GKE garante que a configuração seja fácil e que o escalonamento automático reaja rapidamente aos picos de tráfego para atender à demanda.

O escalonamento automático baseado em tráfego é ativado pelo controlador de gateway e seus recursos de gerenciamento de tráfego global. Para saber mais, consulte Escalonamento automático baseado em tráfego.

O escalonamento automático com base no tráfego do balanceador de carga está disponível apenas para cargas de trabalho do Gateway.

Requisitos

O escalonamento automático baseado em tráfego tem os seguintes requisitos:

Compatível com as versões 1.31 e posteriores do GKE.
API Gateway ativada no cluster do GKE.
Compatível com tráfego que passa pelos balanceadores de carga implantados usando a API Gateway e um destes GatewayClasses: gke-l7-global-external-managed, gke-l7-regional-external-managed, gke-l7-rilb ou gke-l7-gxlb.

Limitações

O escalonamento automático baseado em tráfego tem as seguintes limitações:

Não é compatível com o GatewayClass de vários clusters (gke-l7-global-external-managed-mc, gke-l7-regional-external-managed-mc, gke-l7-rilb-mc e gke-l7-gxlb-mc).
Não é compatível com tráfego usando os Serviços do tipo LoadBalancer.
É necessário haver uma relação clara e isolada entre os componentes envolvidos no escalonamento automático com base no tráfego. Um Escalonador automático horizontal de pods precisa ser dedicado ao escalonamento de uma única implantação (ou qualquer recurso escalonável) exposta por um único serviço.
Depois de configurar a capacidade do serviço usando o campo maxRatePerEndpoint, aguarde tempo suficiente (geralmente um minuto, mas potencialmente até 15 minutos em clusters grandes) para que o balanceador de carga seja atualizado com essa mudança antes de configurar o escalonador automático horizontal de pods com métricas baseadas em tráfego. Isso garante que o serviço não passe temporariamente por uma situação em que o cluster tente fazer o escalonamento automático com base em métricas emitidas por um balanceador de carga ainda em configuração.
Se o escalonamento automático com base no tráfego for usado em um serviço atendido por vários balanceadores de carga (por exemplo, por um Entrada e um Gateway ou por dois Gateways), o escalonador automático horizontal de pods poderá considerar o maior valor de tráfego dos balanceadores de carga individuais para tomar decisões de escalonamento, em vez da soma dos valores de tráfego de todos os balanceadores de carga.

Implantar o escalonamento automático baseado em tráfego

O exercício a seguir usa o HorizontalPodAutoscaler para fazer o escalonamento automático da implantação store-autoscale com base no tráfego recebido. Um gateway aceita o tráfego de entrada da Internet para os pods. O escalonador automático compara sinais de tráfego do gateway com a capacidade de tráfego por pod configurada no recurso de serviço store-autoscale. Ao gerar tráfego para o gateway, você influencia o número de pods implantados.

Veja no diagrama a seguir como o escalonamento automático baseado em tráfego funciona:

HorizontalPodAutoscaler escalonando uma implantação com base no tráfego.

Para implantar o escalonamento automático baseado em tráfego, execute as seguintes etapas:

Para clusters padrão, confirme se as GatewayClasses estão instaladas no cluster. Para clusters do Autopilot, as GatewayClasses são instaladas por padrão.

kubectl get gatewayclass

A saída confirma que os recursos do GatewayClass do GKE estão prontos para uso no cluster:

NAME                               CONTROLLER                  ACCEPTED   AGE
gke-l7-global-external-managed     networking.gke.io/gateway   True       16h
gke-l7-regional-external-managed   networking.gke.io/gateway   True       16h
gke-l7-gxlb                        networking.gke.io/gateway   True       16h
gke-l7-rilb                        networking.gke.io/gateway   True       16h

Se você não encontrar essa saída, ative a API Gateway no cluster do GKE.

Implante o aplicativo de amostra e o balanceador de carga de gateway no cluster:
```
kubectl apply -f https://raw.githubusercontent.com/GoogleCloudPlatform/gke-networking-recipes/master/gateway/docs/store-autoscale.yaml
```
O aplicativo de amostra cria:
- Uma implantação com duas réplicas.
- Um serviço com uma configuração GCPBackendPolicy associada maxRatePerEndpoint definida como 10. Para saber mais sobre os recursos de gateway, consulte Recursos de GatewayClass.
- Um gateway externo para acessar o aplicativo na Internet. Para saber mais sobre como usar balanceadores de carga de gateway, consulte Como implantar gateways.
- Uma HTTPRoute que corresponde a todo o tráfego e a envia para o serviço store-autoscale.
A capacidade do serviço é um elemento essencial ao usar o escalonamento automático baseado em tráfego, porque determina a quantidade de tráfego por pod que aciona um evento de escalonamento automático. Ela é configurada usando um campo maxRatePerEndpoint em uma GCPBackendPolicy associada ao serviço, que define o tráfego máximo que um serviço precisa receber em solicitações por segundo, por pod. A capacidade do serviço é específica do seu aplicativo.

Para mais informações, consulte Como determinar a capacidade do seu serviço.
Salve o seguinte manifesto como hpa.yaml:
```
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: store-autoscale
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: store-autoscale
  # Set the minimum and maximum number of replicas the Deployment can scale to.
  minReplicas: 1
  maxReplicas: 10
  # This section defines that scaling should be based on the fullness of load balancer
  # capacity, using the following configuration.
  metrics:
  - type: Object
    object:
      describedObject:
        kind: Service
        name: store-autoscale
      metric:
        # The name of the custom metric which measures how "full" a backend is
        # relative to its configured capacity.
        name: "autoscaling.googleapis.com|gclb-capacity-fullness"
      target:
        # The target average value for the metric. The autoscaler adjusts the number
        # of replicas to maintain an average capacity fullness of 70% across all Pods.
        averageValue: 70
        type: AverageValue
```
Observação: se você usou o nome da métrica autoscaling.googleapis.com|gclb-capacity-utilization antes, recomendamos que mude para o nome da métrica autoscaling.googleapis.com|gclb-capacity-fullness agora.

Este manifesto descreve um HorizontalPodAutoscaler com as seguintes propriedades:
- minReplicas e maxReplicas: define os números mínimo e máximo de réplicas para esta implantação. Nesta configuração, o número de pods pode ser escalonado de 1 a 10 réplicas.
- describedObject.name: store-autoscale: a referência ao serviço store-autoscale que define a capacidade do tráfego.
- scaleTargetRef.name: store-autoscale: a referência à implantação store-autoscale que define o recurso que é dimensionado pelo Escalonador automático do pod horizontal.
- averageValue: 70: valor médio desejado de 70% de utilização da capacidade. Isso dá ao Escalonador automático horizontal de pods uma margem de crescimento para que os pods em execução possam processar o tráfego excessivo enquanto novos pods estão sendo criados.
Observação: uma implantação ou um serviço não pode ser referenciado por mais de um escalonador automático horizontal de pods. Se essa condição não for atendida, o escalonador automático horizontal de pods vai interromper o escalonamento automático, e os erros vão aparecer nos eventos do escalonador automático horizontal de pods.

O Escalonador automático horizontal de pods resulta no seguinte comportamento de tráfego:

O número de pods é ajustado entre 1 e 10 réplicas para alcançar 70% da taxa máxima por endpoint. Isso resulta em 7 RPS por pod quando maxRatePerEndpoint=10.
Com mais de 7 RPS por pod, o escalonamento vertical dos pods é feito até atingir o máximo de 10 réplicas ou até que o tráfego médio seja de 7 RPS por pod.
Se o tráfego for reduzido, os pods serão reduzidos a uma taxa razoável usando o algoritmo do Escalonador automático horizontal de pods.

Também é possível implantar um gerador de tráfego para validar o comportamento de escalonamento automático baseado em tráfego.

Com 30 RPS, a implantação é escalonada para 5 réplicas para que cada réplica receba 6 RPS de tráfego, o que seria 60% de utilização por pod. Isso está abaixo da meta de utilização de 70%, portanto, os pods são dimensionados adequadamente. Dependendo das flutuações de tráfego, o número de réplicas com escalonamento automático também pode flutuar. Para uma descrição mais detalhada de como o número de réplicas é calculado, consulte Comportamento do escalonamento automático.

Como fazer escalonamento automático com base em uma métrica personalizada ou externa

Para criar autoescaladores de pods horizontais para métricas personalizadas e externas, consulte Otimizar o escalonamento automático de pods com base em métricas.

Como fazer escalonamento automático com base em várias métricas

Neste exemplo, um autoescalador de pod horizontal é criado com escalonamento automático com base na utilização da CPU e em uma métrica personalizada chamada packets_per_second.

Se você seguiu o exemplo anterior e ainda tem um escalonador automático horizontal de pods chamado nginx, exclua-o antes de seguir este exemplo.

Este exemplo requer apiVersion: autoscaling/v2. Para mais informações sobre as APIs disponíveis, consulte Versões da API para objetos HorizontalPodAutoscaler.

Salve este manifesto YAML como um arquivo chamado nginx-multiple.yaml:

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: nginx
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: nginx
  minReplicas: 1
  maxReplicas: 10
  metrics: # The metrics to base the autoscaling on.
  - type: Resource
    resource:
      name: cpu # Scale based on CPU utilization.
      target:
        type: Utilization
        averageUtilization: 50
        # The HPA will scale the replicas to try and maintain an average
        # CPU utilization of 50% across all Pods.
  - type: Resource
    resource:
      name: memory # Scale based on memory usage.
      target:
        type: AverageValue
        averageValue: 100Mi
        # The HPA will scale the replicas to try and maintain an average
        # memory usage of 100 Mebibytes (MiB) across all Pods.
  # Uncomment these lines if you create the custom packets_per_second metric and
  # configure your app to export the metric.
  # - type: Pods
  #   pods:
  #     metric:
  #       name: packets_per_second
  #     target:
  #       type: AverageValue
  #       averageValue: 100

Aplique o manifesto YAML:

kubectl apply -f nginx-multiple.yaml

Quando criado, o escalonador automático horizontal de pods monitora a implantação de nginx para a utilização média da CPU e da memória e, caso tenha removido a marca de comentário, a métrica packets_per_second personalizada. O escalonador automático horizontal de pods faz o escalonamento automático da implantação com base na métrica que tem o valor que criaria o maior evento de escalonamento automático.

Configurar o perfil de HPA de performance

O perfil de desempenho do HPA melhora o tempo de reação do escalonador automático horizontal de pods, permitindo que ele recalcule rapidamente um grande número de objetos HorizontalPodAutoscaler (até 1.000 objetos nas versões secundárias 1.31 a 1.32 e 5.000 objetos na versão 1.33 ou mais recente).

Esse perfil é ativado automaticamente em clusters do Autopilot qualificados com um plano de controle que executa o GKE versão 1.32 ou mais recente. Para clusters padrão, o perfil é ativado automaticamente em clusters qualificados com um plano de controle que executa o GKE versão 1.33 ou mais recente.

Um cluster Standard fica isento da ativação automática do perfil de HPA de desempenho se atender a todas as condições a seguir:

O cluster está fazendo upgrade de uma versão anterior para a 1.33 ou mais recente.
O cluster tem pelo menos um pool de nós com um dos seguintes tipos de máquina: e2-micro, e2-custom-micro, g1-small, f1-micro.
O provisionamento automático de nós não está ativado.

Também é possível ativar o perfil de HPA de desempenho em clusters atuais se eles atenderem aos requisitos.

Requisitos

Para ativar o perfil de HPA de desempenho, verifique se os clusters do Autopilot e do Standard atendem aos seguintes requisitos:

Seu plano de controle está executando a versão 1.31 ou mais recente do GKE.
Se o plano de controle estiver executando o GKE versão 1.31, ative a coleta de métricas do sistema.
A API Autoscaling está ativada no cluster.
Todas as contas de serviço do nó têm o papel roles/autoscaling.metricsWriter atribuído.
Se você usa o VPC Service Controls, verifique se a API Autoscaling está incluída no perímetro de serviço.

Ativar o perfil de HPA de performance

Para ativar o perfil de HPA de desempenho no cluster, use o seguinte comando:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --hpa-profile=performance

Substitua:

CLUSTER_NAME: o nome do cluster.
LOCATION: zona ou região de computação (por exemplo, us-central1-a ou us-central1) do cluster.
PROJECT_ID: o ID do projeto do Google Cloud .

Desativar o perfil de HPA de desempenho

Para desativar o perfil de HPA de desempenho em um cluster, use o seguinte comando:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --hpa-profile=none

Substitua:

CLUSTER_NAME: o nome do cluster.
LOCATION: zona ou região de computação (por exemplo, us-central1-a ou us-central1) do cluster.
PROJECT_ID: o ID do projeto do Google Cloud .

Como visualizar detalhes de um escalonador automático horizontal de pods

Para visualizar a configuração e as estatísticas do escalonador automático horizontal de pods, use o seguinte comando:

kubectl describe hpa HPA_NAME

Substitua HPA_NAME pelo nome do objeto HorizontalPodAutoscaler.

Se o autoescalador de pod horizontal usar apiVersion: autoscaling/v2 e for baseado em várias métricas, o comando kubectl describe hpa mostrará apenas a métrica da CPU. Para ver todas as métricas, use o seguinte comando:

kubectl describe hpa.v2.autoscaling HPA_NAME

Substitua HPA_NAME pelo nome do objeto HorizontalPodAutoscaler.

O status atual de cada escalonador automático horizontal de pods é mostrado no campo Conditions, e os eventos de escalonamento automático são listados no campo Events.

O resultado será assim:

Name:                                                  nginx
Namespace:                                             default
Labels:                                                <none>
Annotations:                                           kubectl.kubernetes.io/last-applied-configuration:
                                                         {"apiVersion":"autoscaling/v2","kind":"HorizontalPodAutoscaler","metadata":{"annotations":{},"name":"nginx","namespace":"default"},"s...
CreationTimestamp:                                     Tue, 05 May 2020 20:07:11 +0000
Reference:                                             Deployment/nginx
Metrics:                                               ( current / target )
  resource memory on pods:                             2220032 / 100Mi
  resource cpu on pods  (as a percentage of request):  0% (0) / 50%
Min replicas:                                          1
Max replicas:                                          10
Deployment pods:                                       1 current / 1 desired
Conditions:
  Type            Status  Reason              Message
  ----            ------  ------              -------
  AbleToScale     True    ReadyForNewScale    recommended size matches current size
  ScalingActive   True    ValidMetricFound    the HPA was able to successfully calculate a replica count from memory resource
  ScalingLimited  False   DesiredWithinRange  the desired count is within the acceptable range
Events:                                                <none>

Como excluir um escalonador automático horizontal de pods

É possível excluir um escalonador automático horizontal de pods usando o console Google Cloud ou o comando kubectl delete.

Console

Para excluir o escalonador automático horizontal de pods nginx, siga estas etapas:

Acesse a página Cargas de trabalho no console Google Cloud .

Acesse "Cargas de trabalho"
Clique no nome da implantação nginx.
Clique em Ações > Escalonamento automático.
Clique em Excluir.

`kubectl delete`

Para excluir o escalonador automático horizontal de pods nginx, use o seguinte comando:

kubectl delete hpa nginx

Quando você exclui um escalonador automático horizontal de pods, a implantação (ou outro objeto de implantação) permanece com o escalonamento existente e não reverte para o número de réplicas no manifesto original da implantação. Para escalonar manualmente a implantação para três pods um outra vez, é possível usar o comando kubectl scale:

kubectl scale deployment nginx --replicas=3

Limpeza

Exclua o escalonador automático horizontal de pods, se ainda não tiver feito isso:
```
kubectl delete hpa nginx
```
Exclua a implantação nginx:
```
kubectl delete deployment nginx
```
Opcionalmente, exclua o cluster.

Solução de problemas

Para receber conselhos sobre solução de problemas, consulte Resolver problemas de escalonamento automático horizontal de pods.

A seguir

Saiba mais sobre o escalonamento automático horizontal de pods.
Saiba mais sobre o Escalonamento automático vertical de pods.
Saiba como otimizar o escalonamento automático de pods com base em métricas.
Saiba mais sobre implantações de escalonamento automático com métricas personalizadas.
Saiba como atribuir recursos da CPU a contêineres e pods.
Saiba como atribuir recursos de memória a contêineres e pods.

Como configurar o escalonamento automático horizontal de pods

Antes de começar

Versões da API para objetos HorizontalPodAutoscaler

Crie a implantação de exemplo

Escalonamento automático com base na utilização de recursos

Console

kubectl apply

kubectl autoscale

Console

kubectl get

Como fazer escalonamento automático com base no tráfego do balanceador de carga

Requisitos

Limitações

Implantar o escalonamento automático baseado em tráfego

Como fazer escalonamento automático com base em uma métrica personalizada ou externa

Como fazer escalonamento automático com base em várias métricas

Configurar o perfil de HPA de performance

Requisitos

Ativar o perfil de HPA de performance

Desativar o perfil de HPA de desempenho

Como visualizar detalhes de um escalonador automático horizontal de pods

Como excluir um escalonador automático horizontal de pods

Console

kubectl delete

Limpeza

Solução de problemas

A seguir

Versões da API para objetos `HorizontalPodAutoscaler`

`kubectl apply`

`kubectl autoscale`

`kubectl get`

`kubectl delete`