Ajuste de escala automático de grupos de instancias

Los grupos de instancias administrados ofrecen funciones de ajuste de escala automático que te permiten agregar o borrar instancias de forma automática de un grupo de instancias administrado según los aumentos o las disminuciones de la carga. El ajuste de escala automático sirve para facilitar a tus apps el manejo de los aumentos de tráfico y reducir los costos cuando la necesidad de recursos es menor. Debes definir la política de ajuste de escala automático y el escalador automático realizará el ajuste de escala según la carga medida.

El ajuste de escala automático agrega más instancias al grupo de instancias cuando hay más carga (escalamiento vertical) y borra instancias cuando se reduce la necesidad de instancias (reducción vertical).

Información básica

Estos son los conceptos y servicios fundamentales que se incluyen en el ajuste de escala automático.

Grupos de instancias administrados

El ajuste de escala automático es una función de los grupos de instancias administrados. Un grupo de instancias administrado es un conjunto de instancias homogéneas, creado a partir de una plantilla de instancias común. Un escalador automático agrega o borra instancias de un grupo de instancias administrado. Si bien Compute Engine cuenta con grupos de instancias administrados y no administrados, solo los administrados pueden usarse con un escalador automático.

Para comprender la diferencia entre un grupo de instancias administrado y uno no administrado, consulta Grupos de instancias.

Política de ajuste de escala automático y uso objetivo

Para crear un escalador automático, especifica la política de ajuste de escala automático y un nivel de uso objetivo que el escalador automático usa para determinar cuándo escalar el grupo. Puedes optar por escalar con las siguientes políticas:

  • Uso de CPU promedio
  • Capacidad de entrega de balanceo de cargas de HTTP, que puede basarse en el uso o las solicitudes por segundo
  • Métricas de Stackdriver Monitoring

El escalador automático recopila de manera continua información de uso en función de la política, compara el uso real con el uso objetivo deseado y determina si el grupo debe escalarse verticalmente o reducirse.

El nivel de uso objetivo es el nivel en el que deseas mantener las instancias de máquina virtual (VM). Por ejemplo, si escalas según el uso de CPU, puedes configurar tu nivel de uso objetivo en un 75% y el escalador automático mantendrá el uso de CPU del grupo especificado de instancias en un 75% o cerca de él. El nivel de uso de cada métrica se interpreta de manera diferente según la política de ajuste de escala automático.

Para ver un breve resumen de cada política, consulta las políticas. Para ver una discusión detallada de cada política, consulta las páginas sobre los siguientes temas:

Período de enfriamiento

Cuando se configura el ajuste de escala automático, especifica un período de enfriamiento para permitir que las instancias terminen de inicializarse antes de que el escalador automático comience a recopilar información de ellas. La información durante el período de arranque de una instancia puede no ser confiable para las decisiones del escalador automático, por lo que es posible que quieras omitir estos datos. De forma predeterminada, el período de enfriamiento es de 60 segundos.

Período de estabilización

Para la reducción, el escalador automático calcula el tamaño objetivo recomendado del grupo en función de la carga máxima durante los últimos 10 minutos. Estos últimos 10 minutos se denominan período de estabilización.

Este período de estabilización de 10 minutos puede aparecer como una demora en la reducción de escala, pero en realidad es una función integrada del ajuste de escala automático. La demora garantiza que el tamaño más pequeño del grupo es suficiente para soportar la carga máxima de los últimos 10 minutos.

Modo de ajuste de escala automático

Si necesitas investigar o configurar tu grupo sin interferencia de las operaciones del escalador automático, puedes desactivar o restringir las actividades de ajuste de escala automático de manera temporal. La configuración del escalador automático persiste mientras está apagado o restringido, y todas las actividades de ajuste de escala automático se reanudan cuando lo vuelves a activar o levantas la restricción.

Especificaciones

  • El ajuste de escala automático solo funciona con los grupos de instancias administrados. Los grupos de instancias no administrados no son compatibles.
  • El ajuste de escala automático no funciona con grupos de instancias administrados si la redistribución proactiva de instancias está inhabilitada.
  • No puedes crear instancias con nombres específicos mientras está activado el ajuste de escala automático. Sin embargo, puedes activar el escalador automático después de crear instancias con nombres específicos.
  • No uses el ajuste de escala automático de Compute Engine con grupos de instancias administrados que sean propiedad de Google Kubernetes Engine. Para los grupos de Google Kubernetes Engine, usa el ajuste de escala automático de clúster en su lugar.

    Si no estás seguro de si tu grupo es parte de un clúster de GKE, busca el prefijo gke en el nombre del grupo de instancias administrado. Por ejemplo, gke-test-1-3-default-pool-eadji9ah.

  • Un escalador automático puede tomar decisiones de escalamiento en función de varias métricas, pero solo puede manejar una política por tipo de métrica, excepto en el caso de las métricas de Stackdriver Monitoring. Un escalador automático puede manejar hasta cinco políticas basadas en las métricas de Monitoring. El escalador automático calcula la cantidad recomendada de máquinas virtuales para cada política y, luego, escala según la política que proporciona la mayor cantidad de máquinas virtuales en el grupo.

  • El ajuste de escala automático funciona sin depender de la reparación automática. Si configuras la reparación automática para tu grupo y una instancia no pasa la verificación de estado, el reparador automático intenta recrear la instancia. Volver a crear una instancia puede hacer que la cantidad de instancias en el grupo caiga por debajo del umbral de ajuste de escala automático (minNumReplicas) que especificas.

Antes de comenzar

  1. Obtén información sobre los grupos de instancias administrados

    Debido a que el escalador automático es una función de los grupos de instancias administrados, obtén información sobre cómo funcionan los grupos de instancias administrados antes de usar el ajuste de escala automático.

  2. Obtén una URL o un nombre de grupo de instancias administrado

    Para todas las solicitudes de ajuste de escala automático, debes proporcionar un nombre o una URL de grupo de instancias administrado. En la herramienta de línea de comandos de gcloud, puedes usar un nombre de grupo de instancias administrado, mientras que la API requiere una URL totalmente calificada.

    Para llevar la URL a un grupo de instancias administrado existente, puedes usar el comando instance-groups managed list --uri o el comando instance-groups managed list [INSTANCE_GROUP] --uri. Por ejemplo, el siguiente comando proporciona la URL de un grupo de instancias administrado en la zona us-central1-f:

    gcloud compute instance-groups managed list example-group --uri --filter="zone:(us-central1-f)"
    

    La herramienta de gcloud muestra la URL del grupo de instancias administrado:

    https://compute.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-group
    

    Si no tienes un grupo de instancias administrado existente, revise cómo crear un grupo de instancias administrado.

Próximos pasos

Cuando estés listo, crea un escalador automático que escale en función de la capacidad de entrega de balanceo de cargas o CPU o de las métricas de Stackdriver Monitoring.

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Documentación de Compute Engine