Balanceo de cargas y escalamiento


Google Cloud ofrece balanceo de cargas y ajuste de escala automático para grupos de instancias.

Balanceo de cargas

Google Cloud ofrece balanceo de cargas en el lado del servidor para que puedas distribuir el tráfico entrante en varias instancias de máquina virtual (VM). El balanceo de cargas proporciona los siguientes beneficios:

  • Escalamiento de tu app
  • Compatibilidad con mucho tráfico
  • Detección y eliminación automática de instancias de máquina virtual en mal estado con la verificación de estado Cuando una instancia recobra el buen estado, se vuelve a agregar de manera automática
  • Enrutamiento del tráfico a la máquina virtual más cercana

El balanceo de cargas de Google Cloud usa recursos de reglas de reenvío para hacer coincidir ciertos tipos de tráfico y reenviarlo a un balanceador de cargas. Por ejemplo, una regla de reenvío puede hacer coincidir el tráfico de TCP destinado al puerto 80 en la dirección IP 192.0.2.1 y, luego, reenviarlo a un balanceador de cargas que lo dirija a instancias de VM en buen estado.

El balanceo de cargas de Google Cloud es un servicio administrado, lo que significa que sus componentes son redundantes y presentan una disponibilidad alta. Si un componente del balanceo de cargas falla, se reinicia o se reemplaza de inmediato de forma automática.

Google Cloud ofrece varios tipos diferentes de balanceo de cargas que difieren en cuanto a sus capacidades, situaciones de uso y formas de configuración. Consulta la documentación de Cloud Load Balancing para obtener descripciones.

Ajuste de escala automático

Compute Engine ofrece ajuste de escala automático para agregar o quitar instancias de VM de un grupo de instancias administrado (MIG) de forma automática en función de los aumentos o disminuciones en la carga. El ajuste de escala automático permite que tus apps administren de forma correcta los aumentos de tráfico y reduce los costos cuando la necesidad de recursos es menor. Puedes realizar un ajuste de escala automático en un MIG según el uso de CPU, las métricas de Cloud Monitoring, los programas o la capacidad de entrega del balanceo de cargas.

Cuando configuras un escalador automático para que realice ajustes en función de la capacidad de procesamiento del balanceo de cargas, este analiza la capacidad de procesamiento de un grupo de instancias y realiza ajustes cuando las instancias de VM están por encima o por debajo de la capacidad. La capacidad activa de una instancia se puede definir en el servicio de backend del balanceador de cargas y se puede basar en el uso o las solicitudes por segundo. Para obtener más información, consulta Cómo escalar en función de la capacidad de entrega de balanceo de cargas.

Para obtener más información sobre el ajuste de escala automático, consulta Ajuste de escala automático en grupos de instancias.

¿Qué sigue?