Balanceo de cargas y escalamiento

Google Cloud ofrece balanceo de cargas y ajuste de escala automático para grupos de instancias.

Balanceo de cargas

Google Cloud ofrece balanceo de cargas en el lado del servidor para que puedas distribuir el tráfico entrante en varias instancias de máquina virtual (VM). El balanceo de cargas proporciona los siguientes beneficios:

  • Escalamiento de tu app
  • Compatibilidad con mucho tráfico
  • Detección y eliminación automática de instancias de máquina virtual en mal estado con la verificación de estado Cuando una instancia recobra el buen estado, se vuelve a agregar de manera automática
  • Enrutamiento del tráfico a la máquina virtual más cercana

El balanceo de cargas de Google Cloud usa recursos de reglas de reenvío para hacer coincidir ciertos tipos de tráfico y reenviarlo a un balanceador de cargas. Por ejemplo, una regla de reenvío puede hacer coincidir el tráfico de TCP destinado al puerto 80 en la dirección IP 192.0.2.1 y, luego, reenviarlo a un balanceador de cargas que lo dirija a instancias de VM en buen estado.

El balanceo de cargas de Google Cloud es un servicio administrado, lo que significa que sus componentes son redundantes y presentan una disponibilidad alta. Si un componente del balanceo de cargas falla, se reinicia o se reemplaza de inmediato de forma automática.

Google Cloud ofrece varios tipos diferentes de balanceo de cargas que difieren en cuanto a sus capacidades, situaciones de uso y formas de configuración. Consulta la documentación de Cloud Load Balancing para obtener descripciones.

Ajuste de escala automático

Compute Engine ofrece ajuste de escala automático para agregar o quitar instancias de VM de un grupo de instancias administrado de forma automática en función de los aumentos o disminuciones en la carga. El ajuste de escala automático permite que tus apps administren de forma correcta los aumentos de tráfico y reduce los costos cuando la necesidad de recursos es menor. Luego de definir la política de ajuste de escala automático, el escalador automático realiza el ajuste correspondiente según la carga medida.

Política de ajuste de escala automático

Para crear un escalador automático, debes especificar al menos una política de ajuste de escala automático. Cada indicador se puede basar en el uso de CPU, la capacidad de entrega del balanceo de cargas, las métricas de Cloud Monitoring o los programas. Si usas una política de ajuste de escala automático con varias señales, el escalador automático escala un grupo de instancias según el indicador que proporciona la mayor cantidad de instancias de VM en el grupo.

En las secciones siguientes, se analizan los indicadores de ajuste de escala automático en general. Para obtener más información sobre cómo configurar una señal de ajuste de escala automático específica, consulta la documentación correspondiente de la señal.

Uso de CPU

El uso de CPU es el ajuste de escala automático más básico que puedes realizar. Con esta política, se le indica al escalador automático que controle el uso de CPU promedio de un grupo de instancias de VM y que agregue o quite instancias del grupo para mantener el nivel de uso deseado. Esto es útil para cuando la configuración requiere mucha CPU, pero cuyo uso de ella puede fluctuar.

Para obtener más información, consulta la página sobre el escalamiento en función del uso de CPU.

Capacidad de procesamiento del balanceo de cargas

Cuando configuras un escalador automático para que realice ajustes en función de la capacidad de procesamiento del balanceo de cargas, este analiza la capacidad de procesamiento de un grupo de instancias y realiza ajustes cuando las instancias de VM están por encima o por debajo de la capacidad.

La capacidad activa de una instancia se puede definir en el servicio de backend del balanceador de cargas y se puede basar en el uso o las solicitudes por segundo.

Para obtener más información, consulta la sección sobre cómo escalar según la capacidad de entrega de un balanceador de cargas de HTTP(S) externo.

Métricas de supervisión

Si exportas o usas métricas de Cloud Monitoring, puedes configurar el ajuste de escala automático para que recopile datos de una métrica específica y realice escalamientos en función del nivel de uso deseado. Puedes escalar en función de las métricas estándar que proporciona Monitoring o con cualquier métrica personalizada que crees.

Para obtener más información, consulta la página Ajusta la escala en función de las métricas de Monitoring.

Programas

El ajuste de escala automático basado en los programas te permite mejorar la disponibilidad de tus cargas de trabajo mediante la programación de la capacidad antes de la carga anticipada. Puedes programar un tamaño de grupo de instancias obligatorio para los patrones de carga recurrentes, así como los eventos únicos.

Para obtener más información, consulta Escala según los programas.

¿Qué sigue?