Restablecer nodos y borrar clústeres

Cuando un clúster de Anthos alojado en Bare Metal está en proceso de instalación, se instalan objetos binarios y servicios systemd en los nodos que alojan a ese clúster, y los servicios comienzan a detectar puertos en los nodos.

Sin embargo, si falla la instalación de un clúster, se deben borrar todos estos objetos binarios y servicios. En otras palabras, los nodos deben restablecerse o limpiarse a fin de prepararlos para reintentar la instalación del clúster. Si los nodos no se restablecen de esta manera, el siguiente intento de instalar un clúster en ellos falla.

En esta página, se describe cómo realizar una operación de limpieza de nodos específicos y cómo borrar un clúster.

Elige un método de eliminación

El método que uses para borrar un clúster depende de los siguientes factores:

  • El tipo de clúster
  • Si solo desea limpiar nodos específicos y no borrar todo el clúster
  • Cómo se creó el clúster.

Los clústeres de Anthos alojados en Bare Metal proporcionan los siguientes métodos de eliminación:

  • Google Cloud Console o Google Cloud CLI:

    • Usa la consola o gcloud CLI para borrar los clústeres de usuario que administra la API de Anthos On-Prem. La API de Anthos On-Prem administra un clúster de usuario si se cumple una de las siguientes condiciones:

  • bmctl:

    • Usa bmctl reset nodes para restablecer nodos específicos.
    • Usa bmctl reset para borrar los clústeres independientes, de administrador y híbridos, y los clústeres de usuario que no administra la API de Anthos On-Prem.

    Si usas bmctl para restablecer nodos o borrar un clúster, el comando espera que el archivo de configuración del clúster esté en el directorio de trabajo actual. De forma predeterminada, la ruta es la siguiente:

    bmctl-workspace/CLUSTER_NAME/CLUSTER_NAME.yaml

    Si usaste la marca --workspace-dir para especificar un directorio diferente durante la creación del clúster, debes usar la marca a fin de especificar el directorio de trabajo durante el restablecimiento del clúster.

  • kubectl:

    • Usa kubectl delete cluster para borrar solo los clústeres de usuario que no son administrados por los clústeres de API de Anthos On-Prem. No ejecutes el comando en otros tipos de clústeres.
    • Ten en cuenta que, si usas kubectl delete cluster, también debes borrar el espacio de nombres en el que se encuentra el clúster después de borrarlo.

Después de borrar un clúster, puedes volver a instalarlo después de realizar los cambios de configuración necesarios.

Borrar clústeres autoadministrados

Para borrar un clúster de administrador, híbrido o independiente, ejecuta el siguiente comando:

bmctl reset --cluster CLUSTER_NAME

En el comando, reemplaza CLUSTER_NAME por el nombre del clúster que deseas restablecer.

El resultado del comando bmctl cluster reset es similar al siguiente ejemplo:

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

Después de que termine la eliminación del clúster, puedes crear uno nuevo. Para ver detalles, consulta Descripción general de la creación de clústeres.

Borrar clústeres de usuario

bmctl

Puedes usar bmctl para borrar los clústeres de usuario que se crearon con bmctl o kubectl.

Ejecuta el siguiente comando para borrar un clúster de usuario con bmctl:

bmctl reset --cluster USER_CLUSTER_NAME --admin-kubeconfig ADMIN_KUBECONFIG_PATH

En el comando, reemplaza las siguientes entradas por información específica de tu entorno:

  • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que deseas borrar.

  • ADMIN_KUBECONFIG_PATH: Es la ruta de acceso al archivo kubeconfig del clúster de administrador asociado. bmctl admite el uso de --kubeconfig como un alias para la marca --admin-kubeconfig.

El resultado del comando bmctl cluster reset es similar al siguiente ejemplo:

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

kubectl

Puedes usar kubectl para borrar los clústeres de usuario que se crearon con bmctl o kubectl. Si quieres usar kubectl para borrar un clúster de usuario, primero debes borrar el objeto del clúster y, luego, su espacio de nombres. De lo contrario, los trabajos para restablecer máquinas no se podrán crear, y el proceso de eliminación podría bloquearse de forma indefinida.

Para borrar un clúster de usuario con kubectl, haz lo siguiente:

  1. Ejecuta el siguiente comando para borrar el objeto del clúster:

    kubectl delete cluster USER_CLUSTER_NAME -n CLUSTER_NAMESPACE \
        --kubeconfig ADMIN_KUBECONFIG_PATH
    

    En el comando, reemplaza las siguientes entradas por información específica de tu entorno:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que deseas borrar.

    • USER_CLUSTER_NAMESPACE: es el espacio de nombres para el clúster. De forma predeterminada, los espacios de nombres de los clústeres de Anthos en equipos físicos son el nombre del clúster precedido por cluster-. Por ejemplo, si le asignas el nombre test al clúster, el espacio de nombres tiene un nombre como cluster-test.

    • ADMIN_KUBECONFIG_PATH: Es la ruta de acceso al archivo kubeconfig del clúster de administrador asociado.

  2. Después de que el clúster se borre de forma correcta, ejecuta el siguiente comando para borrar el espacio de nombres:

    kubectl delete namespace USER_CLUSTER_NAMESPACE --kubeconfig ADMIN_KUBECONFIG_PATH
    

Consola

Si la API de Anthos On-Prem administra el clúster de usuario, sigue estos pasos para borrarlo:

  1. En la consola, ve a la página de clústeres de Anthos.

    Ir a la página Clústeres de Anthos

  2. Selecciona el proyecto de Google Cloud en el que se encuentra el clúster de usuario.

  3. En la lista de clústeres, haz clic en el que deseas editar.

  4. En el panel Detalles, si el Tipo es Anthos (usuario de Bare Metal), sigue estos pasos para borrar el clúster:

    1. En el panel Detalles, haz clic en Ver detalles.

    2. Cerca de la parte superior de la ventana, haz clic en Borrar.

    3. Cuando se te solicite confirmación, haz clic en Borrar de nuevo.

    Si el Tipo es externo, esto indica que el clúster se creó mediante una herramienta de línea de comandos y que no se administra con la API de Anthos On-Prem. En este caso, usa bmctl o kubectl para borrar el clúster.

CLI de gcloud

Si la API de Anthos On-Prem administra el clúster de usuario, sigue estos pasos para borrar el clúster en una computadora que tenga instalada la CLI de gcloud:

  1. Inicia sesión con tu Cuenta de Google:

    gcloud auth login
    
  2. Actualiza los componentes, como se indica a continuación:

    gcloud components update
    
  3. Obtén una lista de clústeres para asegurarte de especificar el nombre correcto en el comando delete:

    gcloud beta container bare-metal clusters list \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION
    

    Reemplaza lo siguiente:

    • FLEET_HOST_PROJECT_ID: Es el ID del proyecto en el que se creó el clúster.

    • LOCATION: Es la ubicación de Google Cloud asociada con el clúster de usuario.

    El resultado es similar a este:

    NAME                      LOCATION    VERSION         ADMIN_CLUSTER            STATE
    example-user-cluster-1a   us-west1    1.13.9          example-admin-cluster-1  RUNNING
    
  4. Ejecuta el siguiente comando para borrar el clúster:

    gcloud beta container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION \
      --force \
      --allow-missing
    

    Reemplaza lo siguiente:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que se borrará.

    • FLEET_HOST_PROJECT_ID: Es el ID del proyecto en el que se creó el clúster.

    • LOCATION: Es la ubicación de Google Cloud asociada con el clúster de usuario.

    La marca --force te permite borrar un clúster que tiene grupos de nodos. Sin la marca --force, primero debes borrar los grupos de nodos y, luego, borrar el clúster.

    La marca --allow-missing es una marca estándar de la API de Google. Cuando incluyes esta marca, el comando muestra el resultado correcto si no se encuentra el clúster.

    Si el comando muestra un error que contiene el texto failed connecting to the cluster's control plane, indica problemas de conectividad con el clúster de administrador, el agente de Connect o el entorno local.

    • Si crees que el problema de conectividad es transitorio, por ejemplo, debido a problemas de red, espera y vuelve a ejecutar el comando.

    • Si el reintento del comando falla, consulta Recopilación de registros de agente de Connect para solucionar problemas con Connect Agent.

    • Si sabes que el clúster de administrador se borró o si las máquinas del nodo para el administrador o el clúster de usuario se cerraron o dejaron de estar sin conexión, incluye la marca --ignore-errors y vuelve a intentar el comando.

Para obtener información sobre otras marcas, consulta la referencia de la CLI de gcloud.

Restablece nodos específicos de un clúster

Es posible que desees restablecer nodos específicos de un clúster si, por ejemplo, se borró un clúster de administrador, pero los clústeres de usuario administrados por ese clúster de administrador se mantienen. En este caso, los clústeres de usuario en su totalidad no se pueden borrar porque se borró el clúster de administrador. Por lo tanto, los nodos de los clústeres de usuario deben restablecerse de forma individual.

Para restablecer los nodos, necesitas una cuenta de servicio con acceso de lectura a Google Container Registry (GCR). El comando bmctl espera el archivo de claves JSON para esta cuenta de servicio como un argumento. Para restablecer nodos individuales de un clúster, ejecuta el siguiente comando:

bmctl reset nodes --addresses NODE_1_IP_ADDRESS,NODE_2_IP_ADDRESS \
    --ssh-private-key-path SSH_KEY_PATH \
    --gcr-service-account-key SERVICE_ACCOUNT_KEY_PATH \
    --login-user root

En el comando, reemplaza las siguientes entradas por información específica de tu entorno:

  • NODE_1_IP_ADDRESS , NODE_2_IP_ADDRESS: Es la lista separada por comas de las direcciones IP de los nodos que deseas borrar.

  • SSH_KEY_PATH: Es la ruta de acceso a la clave privada SSH. Esta es la clave que se usará para establecer conexiones SSH con nodos durante el restablecimiento.

  • SERVICE_ACCOUNT_KEY_PATH: Es la ruta de acceso al archivo JSON que contiene la clave de la cuenta de servicio. Esta clave le otorga permiso a bmctl para extraer imágenes de Google Container Registry. Puedes crear una clave de cuenta de servicio con la consola o gcloud CLI. Para obtener más información, consulta Crea y administra claves de cuentas de servicio. Otra forma de crear el archivo de claves de la cuenta de servicio es si ejecutas el comando create config con la marca --create-service-accounts. Para obtener detalles sobre ese comando, consulta Crea y administra la configuración del clúster con bmctl.

Detalles de la eliminación del clúster

Durante la eliminación, se borran el registro de membresía de la flota del clúster, las activaciones de almacenamiento y los datos de anthos-system StorageClass.

En todos los nodos, se quitan las interfaces del túnel que se usan para las herramientas de redes del clúster y se borran los siguientes directorios:

  • /etc/kubernetes
  • /etc/cni/net.d
  • /root/.kube
  • /var/lib/kubelet

Para nodos del balanceador de cargas:

  • Se borraron los servicios keepalived y haproxy.
  • Se borrarán los archivos de configuración de keepalived y haproxy.