Repara nodos de forma automática

En esta página, se muestra cómo configurar la reparación automática de nodos en Google Kubernetes Engine.

Descripción general

La característica reparación automática de nodos de GKE te ayuda a mantener los nodos de tu clúster en buen estado y en ejecución. Cuando está habilitada, GKE realiza controles periódicos al estado de cada nodo en el clúster. Si un nodo falla en varias verificaciones de estado consecutivas durante un período prolongado, GKE inicia un proceso de reparación para ese nodo.

Criterios de reparación

GKE usa el estado del nodo para determinar si un nodo necesita reparación. Un nodo que informa un estado Ready se considera en buen estado. GKE activa una acción de reparación si un nodo presenta informes de mal estado consecutivos durante un determinado límite de tiempo. El mal estado puede indicar lo siguiente:

  • Un nodo informa un estado NotReady en verificaciones consecutivas durante el límite de tiempo determinado (alrededor de 10 minutos).
  • Un nodo no informa sobre ningún estado durante el límite de tiempo determinado (alrededor de 10 minutos).
  • El disco de arranque de un nodo se quedó sin espacio en el disco durante un período prolongado (alrededor de 30 minutos).

Proceso de reparación de nodos

Si GKE detecta que un nodo necesita reparación, se desvía el nodo y se lo vuelve a crear. Es posible que el desvío no se realice de forma correcta si el nodo no responde o si el estado no es tan bueno como para procesar el comando de desvío.

Si varios nodos necesitan reparación, GKE puede repararlos en paralelo. GKE limita la cantidad de reparaciones en función del tamaño del clúster (los clústeres más grandes tienen un límite mayor) y de la cantidad de nodos dañados en el clúster (el límite disminuye si hay muchos nodos dañados). Si durante cualquier momento del proceso de reparación inhabilitas la reparación automática de nodo, las reparaciones en curso no se cancelan y se completan para cualquier nodo que esté en reparación.

GKE genera una entrada en los registros de operación para todos los eventos de reparación automática. Puedes verificar los registros con el comando gcloud container operations list.

Habilita la reparación de nodos automática

La reparación automática se habilita por grupo de nodos. Cuando creas un clúster, puedes habilitar o inhabilitar la reparación automática para el grupo de nodos predeterminado del clúster. Si creas grupos de nodos adicionales, puedes habilitar o inhabilitar la reparación automática de nodos para esos grupos de nodos, independientemente de la configuración de reparación automática del grupo de nodos predeterminado.

gcloud

Para crear un clúster o grupo de nodos con la reparación automática de nodos habilitada, especifica la opción --enable-autorepair cuando crees tu clúster o grupo de nodos con la herramienta de línea de comandos de gcloud.

Para crear un clúster con reparación automática habilitada, ejecuta el siguiente comando:

gcloud container clusters create [CLUSTER_NAME] --zone [COMPUTE_ZONE] \
--enable-autorepair

Para crear un grupo de nodos con reparación automática habilitada, ejecuta el siguiente comando:

gcloud container node-pools create [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --enable-autorepair

Para habilitar la reparación automática en un grupo de nodos existente, ejecuta el siguiente comando:

gcloud container node-pools update [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --enable-autorepair

Console

Para crear un clúster en el que el grupo de nodos predeterminado tenga habilitada la reparación automática de nodos, realiza los siguientes pasos:

  1. Dirígete al menú Google Kubernetes Engine en GCP Console.

    Ir al menú Google Kubernetes Engine

  2. Haz clic en Crear clúster.

  3. Elige la plantilla Clúster estándar o elige una plantilla adecuada para tu carga de trabajo.

  4. Configura tu clúster como desees.

  5. Haz clic en Más opciones. Selecciona Habilitar reparación automática.

  6. Haz clic en Crear.

Para crear un grupo de nodos con la reparación automática habilitada, realiza los siguientes pasos:

  1. Dirígete al menú Google Kubernetes Engine en GCP Console.

    Ir al menú Google Kubernetes Engine

  2. Haz clic en el botón Editar del clúster, que tiene forma de lápiz.

  3. Desde el menú de Grupos de nodos, Haz clic en Agregar grupo de nodo.

  4. Configura tu grupo de nodos como desees. Luego, haz clic en Más opciones para el grupo de nodos.

  5. Selecciona Habilitar reparación automática.

  6. Haz clic en Guardar para guardar la configuración del grupo de nodos.

  7. Vuelve a hacer clic en Guardar para modificar el clúster.

Para habilitar la reparación automática de nodos en un grupo de nodos existente, realiza los siguientes pasos:

  1. Dirígete al menú Google Kubernetes Engine en GCP Console.

    Ir al menú Google Kubernetes Engine

  2. Haz clic en el botón Editar del clúster, que tiene forma de lápiz.

  3. Desde el menú Grupos de nodos, haz clic en Más opciones para el grupo de nodos que deseas modificar.

  4. Selecciona Habilitar reparación automática.

  5. Haz clic en Guardar para guardar la configuración del grupo de nodos.

  6. Vuelve a hacer clic en Guardar para modificar el clúster.

Inhabilita la reparación de nodos automática

gcloud

Para inhabilitar la reparación automática en un grupo de nodos determinado, ejecuta el siguiente comando:

gcloud container node-pools update [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --no-enable-autorepair

Console

Para inhabilitar la reparación automática de nodos en un grupo de nodos existente, realiza los siguientes pasos:

  1. Dirígete al menú Google Kubernetes Engine en GCP Console.

    Ir al menú Google Kubernetes Engine

  2. Haz clic en el botón Editar del clúster, que tiene forma de lápiz.

  3. Desde el menú Grupos de nodos, haz clic en Más opciones para el grupo de nodos que deseas modificar.

  4. Anula la selección de Habilitar reparación automática.

  5. Haz clic en Guardar para guardar la configuración del grupo de nodos.

  6. Vuelve a hacer clic en Guardar para modificar el clúster.

Qué sigue

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Documentación de Kubernetes Engine