Consulta eventos del escalador automático horizontal de Pods


En esta página, se proporciona información sobre los eventos de decisión que emite el escalador automático de pods horizontal en Google Kubernetes Engine (GKE). Si analizas estos eventos, puedes obtener estadísticas sobre cómo el controlador del escalador automático horizontal de Pods administra el escalamiento de tu carga de trabajo y comprender el proceso de toma de decisiones detrás de sus acciones.

El escalador automático horizontal de Pods emite eventos de decisión, que se almacenan como entradas de registro en Cloud Logging.

Antes de comenzar

Asegúrate de completar los siguientes requisitos previos:

Selecciona o crea un proyecto

Puedes usar un proyecto existente o crear uno nuevo para este instructivo.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

Habilita las APIs

Enable the GKE, and Cloud Logging APIs.

Enable the APIs

Configura Cloud Shell

En este instructivo, usarás Cloud Shell para ejecutar los comandos de gcloud y kubectl. Cloud Shell es un entorno de shell que se usa para administrar recursos alojados en Google Cloud. Viene preinstalado con las herramientas de línea de comandos de Google Cloud CLI y kubectl.

In the Google Cloud console, activate Cloud Shell.

Activate Cloud Shell

Se abrirá una sesión de Cloud Shell dentro de un marco en la parte inferior en la consola.

Antes de ejecutar comandos en este instructivo, asegúrate de que tu proyecto predeterminado esté configurado como el ID del proyecto en el que deseas implementar la app de ejemplo. Si aún no está configurado, ejecuta el siguiente comando en Cloud Shell:

gcloud config set project PROJECT_ID

Reemplaza PROJECT_ID por el ID del proyecto.

Roles y permisos requeridos

Para obtener los permisos que necesitas para habilitar la generación de registros y acceder a ellos y procesarlos, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Requisitos

  • Tu clúster de GKE debe ejecutar la versión 1.31.5-gke.1090000 o una posterior, o 1.32.1-gke.1260000 o una posterior.
  • Habilita Cloud Logging en tu clúster de GKE. Se aplican los precios de Cloud Logging.

Habilita los eventos de decisión del escalador automático horizontal de Pods

Para crear un clúster nuevo con los registros de decisiones de KCP_HPA habilitados, ejecuta el siguiente comando:

gcloud container clusters create CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --logging=SYSTEM,KCP_HPA

Para habilitar los registros de decisiones de KCP_HPA en un clúster existente, ejecuta el siguiente comando:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --logging=SYSTEM,KCP_HPA

Reemplaza lo siguiente:

  • CLUSTER_NAME: Es el nombre del clúster que deseas crear o actualizar.
  • PROJECT_ID: El ID de tu Google Cloud proyecto.
  • LOCATION: Regiones o zonas de procesamiento para el clúster.

Estos comandos permiten exportar los registros que genera KCP_HPA y guardarlos en el destino logName="projects/PROJECT_ID/logs/container.googleapis.com%2Fhpa-controller" dentro de Cloud Logging.

Recupera la configuración de registro actualizada del clúster y revisa la lista de registros para asegurarte de que el registro de KCP_HPA esté habilitado:

gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --flatten=loggingConfig \
    --format='csv[delimiter=",",no-heading](componentConfig.enableComponents)'

El resultado es similar a este:

SYSTEM_COMPONENTS,APISERVER,CONTROLLER_MANAGER,SCHEDULER,KCP_HPA

Inhabilita los eventos de decisión del escalador automático horizontal de Pods

Actualiza un clúster para quitar el componente KCP_HPA de la marca --logging:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --project=PROJECT_ID \
    --logging=SYSTEM

Reemplaza lo siguiente:

  • CLUSTER_NAME: Es el nombre del clúster que deseas crear o actualizar.
  • PROJECT_ID: El ID de tu Google Cloud proyecto.
  • LOCATION: Regiones o zonas de procesamiento para el clúster.

Este comando inhabilita la exportación de los registros que genera KCP_HPA. No puedes recuperarlos con el filtro logName="projects/PROJECT_ID/logs/container.googleapis.com%2Fhpa-controller" en Cloud Logging.

Recupera la configuración de registro actualizada del clúster y revisa la lista de registros para asegurarte de que el registro KCP_HPA esté inhabilitado:

gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION \
    --flatten=loggingConfig \
    --format='csv[delimiter=",",no-heading](componentConfig.enableComponents)'

El resultado es similar a este:

SYSTEM_COMPONENTS,APISERVER,CONTROLLER_MANAGER,SCHEDULER

Tipos de registros

Los eventos de decisión del Horizontal Pod Autoscaler se almacenan en Cloud Logging, en la ubicación logName="projects/PROJECT_ID/logs/container.googleapis.com%2Fhpa-controller" que se encuentra en el bucket _Default del mismo proyecto que tu clúster de GKE. Todos los eventos registrados están en formato JSON y se pueden encontrar en el campo jsonPayload de una entrada de registro.

Asegúrate de comprender las necesidades de almacenamiento de los posibles volúmenes de registro, además de las implicaciones de rendimiento o costo. En los siguientes ejemplos, se explica con qué frecuencia el Horizontal Pod Autoscaler genera cada tipo de evento de decisión:

  • Recomendación atómica: El escalador automático horizontal de pods genera un evento de recomendación atómica cada 15 segundos para cada métrica que supervisa cada objeto HPA de tu clúster. Por ejemplo, si tienes dos objetos HPA en tu clúster y cada uno de ellos supervisa tres métricas, se registrarán seis recomendaciones atómicas cada 15 segundos.

  • Recomendación final: El escalador automático horizontal de pods genera un evento de recomendación final cada 15 segundos para cada objeto HPA en tu clúster. Por ejemplo, si tienes dos objetos HPA en tu clúster, se registrarán dos recomendaciones finales cada 15 segundos.

En total, con dos objetos HPA que cada uno supervisa tres métricas, tu registro de KCP_HPA recibirá ocho entradas de eventos de decisión en total cada 15 segundos.

Recomendación atómica

Un registro de recomendación atómica describe una recomendación basada en una métrica individual especificada en tu escalador automático horizontal de pods.

Un registro atómico incluye los siguientes campos:

Campo Descripción
start_time Indica cuándo la HPA comenzó a calcular una recomendación.
hpa Es el nombre del objeto HPA asociado con la recomendación.
pod_count Indica la cantidad total de Pods asociados con el HPA cuando se realiza la recomendación. Esta cantidad también incluye los pods listos, no listos y omitidos.
metric Proporciona información sobre la especificación y el estado de la métrica que se usa para la recomendación. El campo metric contiene los siguientes subcampos:
  • index: Es el índice de la métrica en el array Spec metrics.
  • type: Es el tipo de métrica con valores de MetricSourceType (por ejemplo, Resource, External).
  • spec: Es el nombre de la métrica y un objetivo establecido en esa métrica.
  • status: Condiciones de estado con respecto a la escalabilidad y las limitaciones de escalamiento.
  • newest_sample_time: Es la marca de tiempo de la muestra de métrica más reciente.
  • newest_sample_age_seconds: Es la antigüedad de la muestra más reciente, medida en segundos, desde que comenzó el procesamiento de recomendaciones. Un valor negativo significa que la muestra de métricas es anterior al inicio del procesamiento.
summary El campo de resumen contiene información sobre el resultado de la recomendación, incluido el número de réplicas sugerido. Si no se puede proponer una recomendación, aparecerá un mensaje de error. El campo summary contiene los siguientes subcampos:
  • dampening: El HPA aplica una atenuación a la recomendación y su dirección para tratar de reducir la magnitud de un posible escalamiento. La atenuación puede ocurrir de las siguientes maneras:
    • up: Una dirección de atenuación hacia arriba significa que el HPA supone que los pods con métricas faltantes tienen un uso del 100% de la métrica.
    • down: Una dirección de atenuación hacia abajo significa que el HPA supone que hay Pods con métricas faltantes o Pods no listos que consumen el 0% de uso de la métrica.
    • none: No se aplica ninguna atenuación.
  • override: Es un mensaje que proporciona un motivo cuando no se aplica la recomendación que propone el HPA (por ejemplo, debido a la tolerancia) o none si no se produce una anulación.
  • result: Es el resultado de la recomendación. Propone una cantidad recomendada de réplicas o muestra un mensaje de error si no se puede calcular la recomendación.

Ejemplo de registro de recomendación atómica:

{
  "insertId": "xiu4bty9k5b279wu",
  "jsonPayload": {
    "instance": {
      "vm_name": "my-unique-vm-identifier",
      "zone": "us-central1-a"
    },
    "atomicRecommendation": {
      "startTime": "2025-02-06T20:07:00.573419526Z",
      "hpa": "gke-managed-cim/kube-state-metrics",
      "metric": {
        "newestSampleAgeSeconds": -39.573419526,
        "status": {
          "averageValue": "25849856"
        },
        "newestSampleTime": "2025-02-06T20:06:21Z",
        "type": "Resource",
        "spec": {
          "target": {
            "averageValue": "400Mi"
          },
          "name": "memory"
        }
      },
      "podCount": {
        "ready": 1,
        "total": 1
      },
      "summary": {
        "override": "none",
        "replicas": 1,
        "dampening": "none"
      }
    }
  },
  "resource": {
    "type": "k8s_control_plane_component",
    "labels": {
      "project_id": "my-project-id",
      "cluster_name": "my-cluster",
      "location": "us-central1-a",
      "component_location": "us-central1-a",
      "component_name": "hpa-controller"
    }
  },
  "timestamp": "2025-02-06T20:07:00.593777835Z",
  "severity": "INFO",
  "labels": {
    "compute.googleapis.com/resource_name": "my-unique-vm-identifier"
  },
  "logName": "projects/my-project-id/logs/container.googleapis.com%2Fhpa-controller",
  "sourceLocation": {
    "file": "event_logger.go",
    "line": "61"
  },
  "receiveTimestamp": "2025-02-06T20:07:05.284753647Z"
}

Recomendación final

Un registro de recomendación final describe una recomendación consolidada que propone el Horizontal Pod Autoscaler. El Horizontal Pod Autoscaler combina todas las recomendaciones atómicas de diferentes métricas para crear una recomendación final y activarlas. La activación significa que el HPA le indica a la implementación que ajuste la cantidad de réplicas para que coincida con el valor recomendado. Si la recomendación final sugiere una cantidad de Pods diferente a la cantidad de Pods en ejecución, el escalador automático de Pods horizontal activa un evento de escalamiento hacia arriba o hacia abajo para ajustar la implementación según corresponda.

Un registro de recomendación final incluye los siguientes campos:

Campo Descripción
start_time Indica cuándo la HPA comenzó a calcular una recomendación.
hpa Es el nombre del objeto HPA asociado con la recomendación.
target_ref Indica el objeto ScaleTargetRef de HPA asociado con una recomendación.
configured_size Es la última cantidad registrada de réplicas antes de que el HPA calcule y aplique esta recomendación.
top_level_override Proporciona un motivo si no se aplica la recomendación que propuso el HPA (por ejemplo, debido a la tolerancia) o none si no se produce ninguna anulación.
top_level_limit Proporciona un motivo si se debe ajustar la recomendación que propone el HPA (por ejemplo, debido a la cantidad de réplicas que definen los campos MinReplicas o MaxReplicas en la especificación del HPA).
leading_metric_index El índice de métrica principal en el array Spec metrics es la métrica cuya recomendación atómica asociada se usa como la recomendación final.
normalization Proporciona un resumen de estabilización y limitación de la siguiente manera, si está presente:

stabilization: Describe el estado de estabilización si se aplicó. La estabilización se usa para restringir el parpadeo del recuento de réplicas cuando las métricas que se usan para el escalamiento siguen fluctuando. El campo stabilization consta de los siguientes subcampos:

  • replicas: Es el número de réplicas después de la estabilización.
  • reason: Es el tipo de estabilización aplicado: scaleUp o scaleDown.
  • stabilization_window: Es el período de estabilización asociado, en segundos.
  • replicas_before_stabilization: Es la cantidad de réplicas recomendada antes de la estabilización.

limitation: Describe cómo se manejan las limitaciones de escalamiento si se aplican. Este comportamiento modifica las recomendaciones que propone la HPA en función de las limitaciones existentes. El campo limitation consta de los siguientes subcampos:

  • replicas: Es el número de réplicas después de la limitación.
  • reason: Es el motivo por el que no se escala más allá del recuento mínimo o máximo de réplicas.
  • scaling_policy: La política de escalamiento que se aplica.
  • selectPolicy: Especifica cómo se selecciona una política cuando se escala en una dirección determinada. MaxChange corresponde a MaxChangePolicySelect; MinChange corresponde a MinChangePolicySelect. Si la escala se inhabilita, el campo selectPolicy no estará presente.
  • replicas_before_limitation: Es la cantidad de réplicas recomendada antes de la limitación.
replicas Cantidad de réplicas recomendada.
actuation_error Un mensaje de error asociado con la falla, si la activación falló.
actuation_time Marca de tiempo de la activación en caso de éxito
actuation_latency_seconds Es el tiempo transcurrido, en segundos, desde el inicio del procesamiento de la recomendación hasta que se realizó correctamente la activación.

Ejemplo de registro de recomendación final:

{
  "insertId": "qzyv7alfv1sm19ns",
  "jsonPayload": {
    "finalRecommendation": {
      "actuationTime": "2025-02-06T20:06:57.487786873Z",
      "targetRef": {
        "name": "kube-state-metrics",
        "kind": "StatefulSet",
        "apiVersion": "apps/v1"
      },
      "topLevelLimit": "none",
      "hpa": "gke-managed-cim/kube-state-metrics",
      "topLevelOverride": "noRecommendation",
      "replicas": 1,
      "configuredSize": 1,
      "actuationLatencySeconds": 0.003722451,
      "startTime": "2025-02-06T20:06:57.484064422Z"
    },
    "instance": {
      "vm_name": "my-unique-vm-identifier",
      "zone": "us-central1-a"
    }
  },
  "resource": {
    "type": "k8s_control_plane_component",
    "labels": {
      "cluster_name": "my-cluster",
      "component_location": "us-central1-a",
      "component_name": "hpa-controller",
      "location": "us-central1-a",
      "project_id": "my-project-id"
    }
  },
  "timestamp": "2025-02-06T20:06:57.488193527Z",
  "severity": "INFO",
  "labels": {
    "compute.googleapis.com/resource_name": "my-unique-vm-identifier"
  },
  "logName": "projects/my-project-id/logs/container.googleapis.com%2Fhpa-controller",
  "sourceLocation": {
    "file": "event_logger.go",
    "line": "61"
  },
  "receiveTimestamp": "2025-02-06T20:06:57.844898727Z"
}

Soluciona problemas

En esta sección, se describen los problemas y los pasos de resolución relacionados con los eventos del escalador horizontal de Pods.

No hay eventos.

Si no ves ningún evento de decisión de Horizontal Pod Autoscaler, asegúrate de haber hecho lo siguiente:

  • Habilitaste Cloud Logging para el clúster.
  • Habilitaste los registros de KCP_HPA para el clúster.
  • Implementaste al menos un objeto hpa configurado correctamente en tu clúster.

Para ver la configuración de tu objeto hpa, ejecuta el siguiente comando:

  kubectl describe hpa $HPA_NAME

Si aún no ves ningún registro de KCP_HPA, comunícate con el Google Cloud equipo de asistencia.

¿Qué sigue?