Nodos de reparación automática

En esta página se muestra cómo configurar la reparación automática de nodo en Google Kubernetes Engine.

Descripción general

La función de reparación automática de nodo de GKE te ayuda a mantener los nodos de tu clúster en buen estado y en ejecución. Cuando está habilitada, GKE realiza controles periódicos al estado de cada nodo en el clúster. Si un nodo falla en varias verificaciones de estado consecutivas durante un período prolongado, GKE inicia un proceso de reparación para ese nodo.

Criterios de reparación

GKE usa el estado del nodo para determinar si un nodo necesita reparación. Si un nodo informa un estado Ready, se considera en buen estado. GKE activa una acción de reparación si un nodo presenta informes de mal estado consecutivos durante un determinado límite de tiempo. Un mal estado puede ser indicador de las siguientes opciones:

  • Un nodo informa un estado NotReady en controles consecutivos durante el límite de tiempo determinado (aproximadamente 10 minutos).
  • Un nodo no informa sobre ningún estado durante el límite de tiempo determinado (aproximadamente 10 minutos).
  • El disco de arranque de un nodo se quedó sin espacio en el disco durante un período prolongado (aproximadamente 30 minutos).

Proceso de reparación del nodo

Si GKE detecta que un nodo necesita reparación, se desvía el nodo y se lo vuelve a crear. Es posible que el desvío no se realice correctamente si el nodo no responde o si el estado no es lo suficientemente bueno como para procesar el comando de desvío.

Si varios nodos necesitan reparación, GKE puede repararlos en paralelo. GKE limita la cantidad de reparaciones en función del tamaño del clúster (los clústeres más grandes tienen un límite mayor) y de la cantidad de nodos dañados en el clúster (el límite disminuye si hay muchos nodos dañados). Si durante cualquier momento del proceso de reparación inhabilitas la reparación automática de nodo, las reparaciones en curso no se cancelan y se completan para cualquier nodo que esté en reparación.

GKE genera una entrada en el registro de operación para todos los eventos de reparación automática. Puedes ver el registro con el comando gcloud container operations list.

Cómo habilitar la reparación automática

La reparación automática se habilita por grupo de nodos. Cuando creas un clúster, puedes habilitar o inhabilitar la reparación automática para el grupo de nodos predeterminado del clúster. Si creas grupos de nodos adicionales, puedes habilitar o inhabilitar la reparación automática de nodo para esos grupos de nodos, independientemente de la configuración de reparación automática del grupo de nodos predeterminado.

gcloud

Para crear un clúster o grupo de nodos con reparación automática de nodo habilitada, especifica la opción --enable-autorepair cuando crees el clúster o grupo de nodos con la herramienta de línea de comandos de gcloud.

Para crear un clúster con reparación automática habilitada, ejecuta el siguiente comando:

gcloud container clusters create [CLUSTER_NAME] --zone [COMPUTE_ZONE] \
--enable-autorepair

Para crear un grupo de nodos con reparación automática habilitada, ejecuta el siguiente comando:

gcloud container node-pools create [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --enable-autorepair

Para habilitar la reparación automática en un grupo de nodos existente, ejecuta el siguiente comando:

gcloud container node-pools update [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --enable-autorepair

Console

Para crear un clúster en el que el grupo de nodos predeterminado tenga reparación automática de nodo habilitada, realiza los siguientes pasos:

  1. Ve al menú de Google Kubernetes Engine en GCP Console.

    Ir al menú de Google Kubernetes Engine

  2. Haz clic en Crear clúster.

  3. Elige la plantilla Clúster estándar o elige una plantilla adecuada para tu carga de trabajo.

  4. Configura tu clúster como desees.

  5. Haz clic en Edición avanzada. Selecciona Habilitar reparación automática.

  6. Haz clic en Crear.

Para crear un grupo de nodos con reparación automática habilitada, realiza los siguientes pasos:

  1. Ve al menú de Google Kubernetes Engine en GCP Console.

    Ir al menú de Google Kubernetes Engine

  2. Haz clic en el botón Editar del clúster, que tiene forma de lápiz.

  3. Desde el menú de Grupos de nodos, Haz clic en Agregar grupo de nodo.

  4. Configura tu grupo de nodos como desees. Luego, haz clic en Edición avanzada para el grupo de nodos.

  5. Selecciona Habilitar reparación automática.

  6. Haz clic en Guardar para guardar la configuración del grupo de nodos.

  7. Haz clic en Guardar de nuevo para modificar el clúster.

Para habilitar la reparación automática de nodo en un grupo de nodos existente, realiza los siguientes pasos:

  1. Ve al menú de Google Kubernetes Engine en GCP Console.

    Ir al menú de Google Kubernetes Engine

  2. Haz clic en el botón Editar del clúster, que tiene forma de lápiz.

  3. Desde el menú de Grupo de nodos, haz clic en Edición avanzada del grupo de nodos que deseas modificar.

  4. Selecciona Habilitar reparación automática.

  5. Haz clic en Guardar para guardar la configuración del grupo de nodos.

  6. Haz clic en Guardar de nuevo para modificar el clúster.

Cómo inhabilitar la reparación automática

gcloud

Para inhabilitar la reparación automática en un grupo de nodos determinado, ejecuta el siguiente comando:

gcloud container node-pools update [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --no-enable-autorepair

Console

Para inhabilitar la reparación automática de nodo en un grupo de nodos existente, realiza los siguientes pasos:

  1. Ve al menú de Google Kubernetes Engine en GCP Console.

    Ir al menú de Google Kubernetes Engine

  2. Haz clic en el botón Editar del clúster, que tiene forma de lápiz.

  3. Desde el menú de Grupo de nodos, haz clic en Edición avanzada del grupo de nodos que deseas modificar.

  4. Anula la selección de Habilitar reparación automática.

  5. Haz clic en Guardar para guardar la configuración del grupo de nodos.

  6. Haz clic en Guardar de nuevo para modificar el clúster.

Qué sigue

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...