Balanceo de cargas y escalamiento

Google Cloud ofrece balanceo de cargas y ajuste de escala automático para grupos de instancias.

Balanceo de cargas

Google Cloud ofrece balanceo de cargas en el lado del servidor para que puedas distribuir el tráfico entrante en varias instancias de máquina virtual (VM). El balanceo de cargas proporciona los siguientes beneficios:

  • Escalamiento de tu app
  • Compatibilidad con mucho tráfico
  • Detección y eliminación automática de instancias de máquina virtual en mal estado con la verificación de estado Cuando una instancia recobra el buen estado, se vuelve a agregar de manera automática
  • Enrutamiento del tráfico a la máquina virtual más cercana

El balanceo de cargas de Google Cloud usa recursos de reglas de reenvío para hacer coincidir ciertos tipos de tráfico y reenviarlo a un balanceador de cargas. Por ejemplo, una regla de reenvío puede hacer coincidir el tráfico de TCP destinado al puerto 80 en la dirección IP 192.0.2.1 y, luego, reenviarlo a un balanceador de cargas que lo dirija a instancias de VM en buen estado.

El balanceo de cargas de Google Cloud es un servicio administrado, lo que significa que sus componentes son redundantes y presentan una disponibilidad alta. Si un componente del balanceo de cargas falla, se reinicia o se reemplaza de inmediato de forma automática.

Google Cloud ofrece varios tipos diferentes de balanceo de cargas que difieren en cuanto a sus capacidades, situaciones de uso y formas de configuración. Consulta la documentación de Cloud Load Balancing para obtener descripciones.

Ajuste de escala automático

Compute Engine ofrece ajuste de escala automático para agregar o quitar instancias de VM de un grupo de instancias de forma automática en función de los aumentos o disminuciones en la carga. El ajuste de escala automático permite que tus apps administren de forma correcta los aumentos de tráfico y reduce los costos cuando la necesidad de recursos es menor. Luego de definir la política de ajuste de escala automático, el escalador automático realiza el ajuste correspondiente según la carga medida.

Políticas

Para crear un escalador automático, debes especificar al menos una política de ajuste de escala automático. Puedes elegir una política de acuerdo con el uso de CPU, la capacidad de procesamiento del balanceo de cargas o las métricas de Stackdriver Monitoring. Si usas varias políticas, el escalador automático ajustará la escala de un grupo de instancias según la política que proporciona la mayor cantidad de instancias de VM en el grupo.

En las secciones siguientes, se analizan las políticas de ajuste de escala automático de forma general. Para obtener más información sobre cómo configurar una política específica de ajuste de escala automático, consulta la documentación correspondiente a la política.

Uso de CPU

El uso de CPU es el ajuste de escala automático más básico que puedes realizar. Con esta política, se le indica al escalador automático que controle el uso de CPU promedio de un grupo de instancias de VM y que agregue o quite instancias del grupo para mantener el nivel de uso deseado. Esto es útil para cuando la configuración requiere mucha CPU, pero cuyo uso de ella puede fluctuar.

Para obtener más información, consulta la página sobre el escalamiento en función del uso de CPU.

Capacidad de procesamiento del balanceo de cargas

Cuando configuras un escalador automático para que realice ajustes en función de la capacidad de procesamiento del balanceo de cargas, este analiza la capacidad de procesamiento de un grupo de instancias y realiza ajustes cuando las instancias de VM están por encima o por debajo de la capacidad.

La capacidad de procesamiento de una instancia se puede definir en el servicio de backend del balanceador de cargas y se puede basar en el uso o las solicitudes por segundo.

Para obtener más información, consulta la sección sobre cómo escalar en función de la capacidad de procesamiento del balanceo de cargas de HTTP(S).

Métricas de supervisión

Si exportas o usas métricas de Stackdriver Monitoring, puedes configurar el ajuste de escala automático para que recopile datos de una métrica específica y realice escalamientos en función del nivel de uso deseado. Es posible hacer escalamientos en función de las métricas estándar que proporciona Stackdriver Monitoring o mediante el uso de cualquier métrica personalizada que crees.

Para obtener más información, consulta la página Ajusta la escala según las métricas de Stackdriver Monitoring.

Próximos pasos