La forma más sencilla de autoescalado es escalar un grupo de instancias gestionadas (MIG) en función del uso de la CPU de sus instancias.
También puedes autoescalar un MIG en función de la capacidad de servicio del balanceo de carga, las métricas de Monitoring o las programaciones.
Antes de empezar
- Consulta las limitaciones de la herramienta de ajuste automático de escala.
- Consulta los conceptos básicos del escalado automático.
-
Si aún no lo has hecho, configura la autenticación.
La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud init
Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
- Set a default region and zone.
REST
Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.
Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud init
Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .
Escalar según uso de CPU
Puedes autoescalar en función del uso medio de CPU de un grupo de instancias gestionado (MIG). Si se usa esta política, se indica al autoescalador que recoja la utilización de la CPU de las instancias del grupo y determine si es necesario escalarlas. Tú defines el uso de CPU objetivo que debe mantener el autoescalador y este se encarga de mantener ese nivel.
El escalador automático trata el nivel de uso de CPU objetivo como una fracción del uso medio de todas las vCPUs a lo largo del tiempo en el grupo de instancias. Si la utilización media del total de tus vCPUs supera la utilización objetivo, el escalador automático añade más instancias de VM. Si el uso medio de tus vCPUs totales es inferior al uso previsto, el autoescalador elimina instancias. Por ejemplo, si se define un uso objetivo del 0,75, el autoescalador mantendrá un uso medio del 75% entre todas las vCPUs del grupo de instancias.
También puedes escalar en función del uso de CPU previsto. Para obtener más información y saber si esta opción es adecuada para tu carga de trabajo, consulta Escalar en función de las predicciones.
Habilitar el autoescalado basado en el uso de CPU
Consola
En la consola, ve a la página Grupos de instancias.
Si tienes un grupo de instancias, haz clic en su nombre y, a continuación, en Editar. En la página de edición del grupo de instancias, haz lo siguiente:
- Haga clic en Tamaño del grupo y escalado automático para desplegar la sección.
- Haz clic en Configurar autoescalado.
Si no tienes ningún grupo de instancias, haz clic en Crear grupo de instancias y sigue estos pasos:
- En el campo Nombre, especifica un nombre para el grupo.
- En la lista Plantilla de instancia, selecciona una plantilla.
En la sección Ubicación, en función de si vas a crear un MIG de zona o de región, elige una opción de la siguiente manera:
- En el caso de un MIG zonal, selecciona Una sola zona y, a continuación, una región y una zona.
- En el caso de un MIG regional, selecciona Varias zonas y, a continuación, una región y las zonas.
En la sección Autoescalado, se añade de forma predeterminada una señal de autoescalado de uso de la CPU. Puede usar los valores predeterminados de la señal o hacer lo siguiente:
- Especifica el número mínimo y máximo de instancias que quieres que el escalador automático cree en este grupo.
Para editar el uso de CPU objetivo, haz clic en la señal de uso de CPU para desplegar la sección y especificar el porcentaje.
- En Autoescalado predictivo, selecciona Desactivado. Para obtener más información sobre el autoescalado predictivo y si es adecuado para tu carga de trabajo, consulta Escalar en función de las predicciones.
Haz clic en Listo.
Puedes usar el periodo de inicialización para indicar al autoescalador cuánto tiempo tarda tu aplicación en inicializarse. Si especificas un periodo de inicialización preciso, la herramienta de adaptación dinámica tomará mejores decisiones. Por ejemplo, al escalar horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que esas VMs aún no representen el uso normal de tu aplicación. El periodo de inicialización predeterminado es de 60 segundos.
Haz clic en Guardar.
gcloud
Usa el subcomando
set-autoscaling
para habilitar el autoescalado en un grupo de instancias gestionado. Por ejemplo, el siguiente comando crea un escalador automático que tiene un uso de CPU objetivo del 60%. Junto con el parámetro--target-cpu-utilization
, también se necesita el parámetro--max-num-replicas
al crear un escalador automático:gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \ --max-num-replicas 20 \ --target-cpu-utilization 0.60 \ --cool-down-period 90
Puedes usar la marca
--cool-down-period
para definir el periodo de inicialización, que indica al autoescalador cuánto tarda tu aplicación en inicializarse. Si especificas un periodo de inicialización preciso, la herramienta de adaptación dinámica tomará mejores decisiones. Por ejemplo, al escalar horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que esas VMs aún no representen el uso normal de tu aplicación. El periodo de inicialización predeterminado es de 60 segundos.También puedes habilitar el autoescalado predictivo para aumentar la escala antes de la carga prevista. Para saber si el autoescalado predictivo es adecuado para tu carga de trabajo, consulta Escalar en función de las predicciones.
Para verificar que el autoescalado se ha habilitado correctamente, usa el subcomando
instance-groups managed describe
, que describe el grupo de instancias gestionado correspondiente y proporciona información sobre las funciones de autoescalado de ese grupo de instancias:gcloud compute instance-groups managed describe example-managed-instance-group
Para ver una lista de los comandos y las marcas de
gcloud
disponibles, consulta la referencia degcloud
.REST
Para crear un escalador automático, usa el método
autoscalers.insert
para un MIG zonal o el métodoregionAutoscalers.insert
para un MIG regional.En el siguiente ejemplo se crea una herramienta de escalado automático para un MIG zonal:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers/
El cuerpo de la solicitud debe contener los campos
name
,target
yautoscalingPolicy
.autoscalingPolicy
debe definircpuUtilization
ymaxNumReplicas
.Puedes usar el campo
coolDownPeriodSec
para definir el periodo de inicialización, que indica al autoescalador cuánto tarda tu aplicación en inicializarse. Si especificas un periodo de inicialización preciso, la herramienta de adaptación dinámica tomará mejores decisiones. Por ejemplo, al escalar horizontalmente, el escalador automático ignora los datos de las VMs que aún se están inicializando, ya que es posible que esas VMs aún no representen el uso normal de tu aplicación. El periodo de inicialización predeterminado es de 60 segundos.También puedes habilitar el autoescalado predictivo para aumentar la escala antes de la carga prevista. Para saber si el autoescalado predictivo es adecuado para tu carga de trabajo, consulta Escalar en función de las predicciones.
{ "name": "example-autoscaler", "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group", "autoscalingPolicy": { "maxNumReplicas": 10, "cpuUtilization": { "utilizationTarget": 0.6 }, "coolDownPeriodSec": 90 } }
Para obtener más información sobre cómo habilitar el autoescalado en función del uso de la CPU, completa el tutorial Usar el autoescalado con aplicaciones muy escalables.
Cómo gestiona la herramienta de ajuste automático una utilización elevada de la CPU
Durante los periodos de uso intensivo de la CPU, si el uso se acerca al 100%, el autoescalador estima que el grupo ya podría estar muy sobrecargado. En estos casos, la herramienta de escalado automático aumenta el número de máquinas virtuales en un 50% como máximo.
Siguientes pasos
- Consulta cómo habilitar el autoescalado predictivo.
- Consulta información sobre cómo gestionar escaladores automáticos.
- Consulta cómo toman decisiones las herramientas de ajuste automático de escala.
- Consulta cómo usar varias señales de autoescalado para escalar tu grupo.
A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-09-12 (UTC).
-