Se usó la API de Cloud Translation para traducir esta página.

Balanceo de cargas y escalamiento

Google Cloud ofrece balanceo de cargas y ajuste de escala automático para grupos de instancias.

Balanceo de cargas

Google Cloud ofrece balanceo de cargas del lado del servidor para que puedas distribuir el tráfico entrante en varias instancias de máquina virtual (VM). El balanceo de cargas proporciona los siguientes beneficios:

Escalamiento de tu app
Compatibilidad con mucho tráfico
Detección y eliminación automática de instancias de máquina virtual en mal estado con la verificación de estado Cuando una instancia recobra el buen estado, se vuelve a agregar de manera automática
Enrutamiento del tráfico a la máquina virtual más cercana

Google Cloud usa recursos de reglas de reenvío para hacer coincidir ciertos tipos de tráfico y reenviarlo a un balanceador de cargas. Por ejemplo, una regla de reenvío puede hacer coincidir el tráfico de TCP destinado al puerto 80 en la dirección IP 192.0.2.1 y, luego, reenviarlo a un balanceador de cargas que lo dirija a instancias de VM en buen estado.

Google Cloud load balancing es un servicio administrado, lo que significa que sus componentes son redundantes y presentan una alta disponibilidad. Si un componente del balanceo de cargas falla, se reinicia o se reemplaza de inmediato de forma automática.

Google Cloud ofrece varios tipos diferentes de balanceo de cargas que difieren en cuanto a sus capacidades, situaciones de uso y formas de configuración. Consulta la Google Cloud documentación sobre el balanceo de cargas para obtener descripciones.

Ajuste de escala automático

Compute Engine ofrece ajuste de escala automático para agregar o quitar instancias de VM de un grupo de instancias administrado (MIG) de forma automática en función de los aumentos o disminuciones en la carga. El ajuste de escala automático permite que tus apps administren de forma correcta los aumentos de tráfico y reduce los costos cuando la necesidad de recursos es menor. Puedes realizar un ajuste de escala automático en un MIG según el uso de CPU, las métricas de Cloud Monitoring, los programas o la capacidad de entrega del balanceo de cargas.

Cuando configuras un escalador automático para que realice ajustes en función de la capacidad de procesamiento del balanceo de cargas, este analiza la capacidad de procesamiento de un grupo de instancias y realiza ajustes cuando las instancias de VM están por encima o por debajo de la capacidad. La capacidad activa de una instancia se puede definir en el servicio de backend del balanceador de cargas y se puede basar en el uso o las solicitudes por segundo. Para obtener más información, consulta Cómo escalar en función de la capacidad de entrega de balanceo de cargas.

Para obtener más información sobre el ajuste de escala automático, consulta Ajuste de escala automático en grupos de instancias.

¿Qué sigue?

Obtén más información sobre los grupos de instancias.
Obtén más información sobre cómo hacer ajustes de escala automáticos en los grupos de instancias administrados en función de los siguientes puntos:
Obtén más información sobre cómo elegir un balanceador de cargas y
- Cómo configurar un Balanceador de cargas de aplicaciones externo
- Cómo configurar un Balanceador de cargas de red de transferencia externa