Esta página se ha traducido con Cloud Translation API.

Escalar según uso de CPU

La forma más sencilla de autoescalado es escalar un grupo de instancias gestionadas (MIG) en función del uso de la CPU de sus instancias.

También puedes autoescalar un MIG en función de la capacidad de servicio del balanceo de carga, las métricas de Monitoring o las programaciones.

Antes de empezar

Consulta las limitaciones de la herramienta de ajuste automático de escala.
Consulta los conceptos básicos del escalado automático.
Si aún no lo has hecho, configura la autenticación. La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
  gcloud init
  Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
  
  Nota: Si ya has instalado la CLI de gcloud, asegúrate de que tienes la versión más reciente ejecutando gcloud components update.
2. Set a default region and zone.
REST

Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.
Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .

Escalar según uso de CPU

Puedes autoescalar en función del uso medio de CPU de un grupo de instancias gestionado (MIG). Si se usa esta política, se indica al autoescalador que recoja la utilización de la CPU de las instancias del grupo y determine si es necesario escalarlas. Tú defines el uso de CPU objetivo que debe mantener el autoescalador y este se encarga de mantener ese nivel.

El escalador automático trata el nivel de uso de CPU objetivo como una fracción del uso medio de todas las vCPUs a lo largo del tiempo en el grupo de instancias. Si la utilización media del total de tus vCPUs supera la utilización objetivo, el escalador automático añade más instancias de VM. Si el uso medio de tus vCPUs totales es inferior al uso previsto, el autoescalador elimina instancias. Por ejemplo, si se define un uso objetivo del 0,75, el autoescalador mantendrá un uso medio del 75% entre todas las vCPUs del grupo de instancias.

También puedes escalar en función del uso de CPU previsto. Para obtener más información y saber si esta opción es adecuada para tu carga de trabajo, consulta Escalar en función de las predicciones.

Habilitar el autoescalado basado en el uso de CPU

Permisos que se necesitan para completar esta tarea

Para realizar esta tarea, debes tener los siguientes permisos:

compute.autoscalers.create en el proyecto
compute.instanceGroupManagers.use en el proyecto

Consola

En la consola, ve a la página Grupos de instancias.

Ir a Grupos de instancias
Si tienes un grupo de instancias, haz clic en su nombre y, a continuación, en Editar. En la página de edición del grupo de instancias, haz lo siguiente:
1. Haga clic en Tamaño del grupo y escalado automático para desplegar la sección.
2. Haz clic en Configurar autoescalado.
Si no tienes ningún grupo de instancias, haz clic en Crear grupo de instancias y sigue estos pasos:
1. En el campo Nombre, especifica un nombre para el grupo.
2. En la lista Plantilla de instancia, selecciona una plantilla.
3. En la sección Ubicación, en función de si vas a crear un MIG de zona o de región, elige una opción de la siguiente manera:
  - En el caso de un MIG zonal, selecciona Una sola zona y, a continuación, una región y una zona.
  - En el caso de un MIG regional, selecciona Varias zonas y, a continuación, una región y las zonas.
En la sección Autoescalado, se añade de forma predeterminada una señal de autoescalado de uso de la CPU. Puede usar los valores predeterminados de la señal o hacer lo siguiente:
1. Especifica el número mínimo y máximo de instancias que quieres que el escalador automático cree en este grupo.
2. Para editar el uso de CPU objetivo, haz clic en la señal de uso de CPU para desplegar la sección y especificar el porcentaje.
  1. En Autoescalado predictivo, selecciona Desactivado. Para obtener más información sobre el autoescalado predictivo y si es adecuado para tu carga de trabajo, consulta Escalar en función de las predicciones.
3. Haz clic en Listo.
Puedes usar el periodo de inicialización para indicar al autoescalador cuánto tiempo tarda tu aplicación en inicializarse. Si especificas un periodo de inicialización preciso, la herramienta de adaptación dinámica tomará mejores decisiones. Por ejemplo, al escalar horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que esas VMs aún no representen el uso normal de tu aplicación. El periodo de inicialización predeterminado es de 60 segundos.
Haz clic en Guardar.

gcloud

Usa el subcomando set-autoscaling para habilitar el autoescalado en un grupo de instancias gestionado. Por ejemplo, el siguiente comando crea un escalador automático que tiene un uso de CPU objetivo del 60%. Junto con el parámetro --target-cpu-utilization, también se necesita el parámetro --max-num-replicas al crear un escalador automático:

gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \
    --max-num-replicas 20 \
    --target-cpu-utilization 0.60 \
    --cool-down-period 90

Puedes usar la marca --cool-down-period para definir el periodo de inicialización, que indica al autoescalador cuánto tarda tu aplicación en inicializarse. Si especificas un periodo de inicialización preciso, la herramienta de adaptación dinámica tomará mejores decisiones. Por ejemplo, al escalar horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que esas VMs aún no representen el uso normal de tu aplicación. El periodo de inicialización predeterminado es de 60 segundos.

También puedes habilitar el autoescalado predictivo para aumentar la escala antes de la carga prevista. Para saber si el autoescalado predictivo es adecuado para tu carga de trabajo, consulta Escalar en función de las predicciones.

Para verificar que el autoescalado se ha habilitado correctamente, usa el subcomando instance-groups managed describe, que describe el grupo de instancias gestionado correspondiente y proporciona información sobre las funciones de autoescalado de ese grupo de instancias:

gcloud compute instance-groups managed describe example-managed-instance-group

Para ver una lista de los comandos y las marcas de gcloud disponibles, consulta la referencia de gcloud.

REST

Para crear un escalador automático, usa el método autoscalers.insert para un MIG zonal o el método regionAutoscalers.insert para un MIG regional.

En el siguiente ejemplo se crea una herramienta de escalado automático para un MIG zonal:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/

El cuerpo de la solicitud debe contener los campos name, target y autoscalingPolicy. autoscalingPolicy debe definir cpuUtilization y maxNumReplicas.

Puedes usar el campo coolDownPeriodSec para definir el periodo de inicialización, que indica al autoescalador cuánto tarda tu aplicación en inicializarse. Si especificas un periodo de inicialización preciso, la herramienta de adaptación dinámica tomará mejores decisiones. Por ejemplo, al escalar horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que esas VMs aún no representen el uso normal de tu aplicación. El periodo de inicialización predeterminado es de 60 segundos.

{
  "name": "example-autoscaler",
  "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group",
  "autoscalingPolicy": {
    "maxNumReplicas": 10,
    "cpuUtilization": {
      "utilizationTarget": 0.6
    },
    "coolDownPeriodSec": 90
  }
}

Para obtener más información sobre cómo habilitar el autoescalado en función del uso de la CPU, completa el tutorial Usar el autoescalado con aplicaciones muy escalables.

Cómo gestiona la herramienta de ajuste automático una utilización elevada de la CPU

Durante los periodos de uso intensivo de la CPU, si el uso se acerca al 100%, el autoescalador estima que el grupo ya podría estar muy sobrecargado. En estos casos, la herramienta de escalado automático aumenta el número de máquinas virtuales en un 50% como máximo.

Siguientes pasos

Consulta cómo habilitar el autoescalado predictivo.
Consulta información sobre cómo gestionar escaladores automáticos.
Consulta cómo toman decisiones las herramientas de ajuste automático de escala.
Consulta cómo usar varias señales de autoescalado para escalar tu grupo.

Escalar según uso de CPU

Antes de empezar

Console

gcloud

REST

Escalar según uso de CPU

Habilitar el autoescalado basado en el uso de CPU

Permisos que se necesitan para completar esta tarea

Consola

gcloud

REST

Cómo gestiona la herramienta de ajuste automático una utilización elevada de la CPU

Siguientes pasos