Clústeres regionales

En esta página se explica cómo funcionan los clústeres regionales. Para obtener más información sobre cómo crear clústeres regionales, consulta Crear clúster.

Descripción general

Según la configuración predeterminada, un clúster crea su instancia principal y sus nodos en una zona de procesamiento única que especificas en el momento de la creación. Para mejorar la disponibilidad y la resistencia de tus clústeres, puedes crear clústeres regionales.

Un clúster regional ofrece un solo extremo estático para todo el clúster y dispersa sus pods entre varias zonas de una región. Esto te permite acceder al plano de control del clúster incluso durante una interrupción o tiempo de inactividad en una zona específica o más, pero no en todas.

Los clústeres regionales distribuyen los recursos de Kubernetes en múltiples zonas dentro de una región. Los nodos y las instancias principales de un clúster regional se dispersan entre varias zonas. La cantidad predeterminada de instancias principales, de nodos por zona y de zonas incluidas es de tres, pero puedes reducir o aumentar esta cantidad a fin de obtener el tamaño y la cantidad de zonas que se adapten mejor a tu clúster.

Tú decides si tu clúster es zonal o regional cuando lo creas. No puedes convertir un clúster zonal existente en uno regional o viceversa.

Limitaciones

  • De forma predeterminada, los clústeres regionales constan de nueve nodos que se reparten de manera uniforme entre tres zonas de una región. Esto consume nueve direcciones IP. Si lo deseas, puedes reducir la cantidad de nodos a uno por zona. A las cuentas de Google Cloud Platform creadas recientemente solo se les otorgan ocho direcciones IP por región, por lo que es posible que debas solicitar un aumento en tu cuota de direcciones IP regionales en uso, según el tamaño de tu clúster regional. Si tienes demasiado pocas direcciones IP en uso disponibles, la creación del clúster fallará.
  • En el caso de los clústeres regionales que ejecutan GPU, no existe ninguna región que tenga algún tipo de GPU en tres zonas. Si deseas ejecutar GPU en un clúster regional, debes especificar zonas que usen la marca --node-locations.

    Si intentas crear un clúster de GPU que abarque tres zonas, verás un error similar al siguiente:

    ERROR: (gcloud.container.clusters.create) ResponseError: code=400, message=
              (1) accelerator type "nvidia-tesla-k80" does not exist in zone us-west1-c.
              (2) accelerator type "nvidia-tesla-k80" does not exist in zone us-west1-a.
  • No puedes crear grupos de nodos en zonas ajenas a las zonas del clúster. Sin embargo, puedes cambiar las zonas de un clúster, lo que provocará que todos los nodos nuevos y existentes abarquen esas zonas.

Precios

Los clústeres regionales se ofrecen sin costo adicional.

Para usar clústeres regionales, se requiere que las cuotas regionales de tu proyecto sean mayores. Asegúrate de que comprendes los precios de Google Kubernetes Engine y tus cuotas antes de usar clústeres regionales. Si detectas un error Insufficient regional quota to satisfy request for resource, se debe a que tu solicitud excede la cuota disponible en la región actual.

Además, se te cobra por el tráfico de nodo a nodo en las zonas. Por ejemplo, si tenías un servicio en una zona que debía comunicarse con un servicio de otra zona, se te cobrará por el tráfico de red entre zonas. Para obtener más información, consulta los precios de "Salida entre zonas de la misma región (por GB)" en la página precios de Compute Engine.

Cómo funcionan los clústeres regionales

Los clústeres regionales replican los nodos y las instancias principales entre varias zonas de una misma región. Por ejemplo, un clúster regional en us-east1 crea instancias principales y nodos en las tres zonas de us-east1: us-east1-b, us-east1-c y us-east1-d. Esto garantiza una mayor disponibilidad de recursos y protege los clústeres del tiempo de inactividad zonal, ya que los clústeres regionales y sus recursos no fallan si se producen errores en una sola zona. En caso de que ocurra una interrupción en la infraestructura, el plano de control regional sigue disponible y los nodos se pueden rebalancear de forma manual o con el escalador automático del clúster.

Entre los beneficios de usar clústeres regionales, se encuentran los siguientes:

  • Resistencia a fallas en una zona. Los clústeres regionales están disponibles en una región en lugar de estar solo en una zona de una región. Si solo una zona deja de estar disponible, el plano de control de Kubernetes y tus recursos no se ven afectados.
  • El tiempo de inactividad es inexistente durante las actualizaciones de la instancia principal y muy reducido durante las fallas. Los clústeres regionales ofrecen un plano de control de alta disponibilidad que te permite acceder a él incluso durante las actualizaciones.

Almacenamiento continuo en clústeres regionales

Los discos de almacenamiento continuo son recursos zonales. Cuando agregas almacenamiento continuo a tu clúster, GKE asigna automáticamente el disco a una zona, a menos que especifiques una. GKE la seleccione de forma aleatoria. Cuando usas StatefulSet, los discos persistentes aprovisionados de cada replica se reparten entre varias zonas.

Cuando se aprovisiona un disco persistente, los pods que hagan referencia a él se programan en la misma zona donde este se encuentre.

Un disco persistente de lectura y escritura no se puede asignar a varios nodos.

Ajuste de escala automático de clústeres regionales

Puedes usar el escalador automático del clúster para escalar automáticamente los clústeres regionales. En las siguientes secciones se ofrecen más consideraciones para usar el escalador automático del clúster con clústeres regionales.

Sobreaprovisionar los límites de escalamiento

Para mantener la capacidad en caso de que ocurra una falla zonal, puedes sobreaprovisionar tus límites de escalamiento.

Por ejemplo, si sobreaprovisionas un clúster de tres zonas al 150%, puedes garantizar que el 100% del tráfico se enrutará a zonas disponibles si se pierde un tercio de la capacidad del clúster. En el ejemplo anterior, esto se lograría si especificas un máximo de seis nodos por zona en lugar de cuatro. Si una zona falla, el clúster escala a doce nodos en las zonas restantes.

De manera similar, si sobreaprovisionas un clúster de dos zonas al 200%, puedes garantizar que el 100% del tráfico se enruta si se pierde la mitad de la capacidad del clúster.

Para obtener más información sobre el escalador automático del clúster, consulta la documentación de escalador automático del clúster o las Preguntas frecuentes sobre el ajuste de escala automático en la documentación de Kubernetes.

Límites del ajuste de escala automático

Para obtener información sobre los límites del ajuste de escala automático de los clústeres regionales, consulta Límites del ajuste de escala automático.

Balance entre zonas

Para obtener información sobre cómo el escalador automático de clústeres balancea el tamaño de tu clúster entre las zonas, consulta Balanceo entre zonas.

Pasos siguientes

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...