Restablece los nodos y borra los clústeres

Cuando un clúster de Google Distributed Cloud está en proceso de instalación, los objetos binarios y los servicios systemd se instalan en los nodos que alojan a ese clúster, y los servicios comienzan a detectar los puertos en los nodos.

Sin embargo, si falla la instalación de un clúster, se deben borrar todos estos objetos binarios y servicios. En otras palabras, los nodos deben restablecerse o limpiarse a fin de prepararlos para reintentar la instalación del clúster. Si los nodos no se restablecen de esta manera, el siguiente intento de instalar un clúster en ellos falla.

En esta página, se describe cómo realizar esta operación de limpieza de nodos específicos y cómo borrar un clúster.

Elige un método de eliminación

El método que usas para borrar un clúster depende de lo siguiente:

  • El tipo de clúster.
  • Si quieres limpiar solo nodos específicos y no todo el clúster,
  • Cómo se creó el clúster.

Google Distributed Cloud proporciona los siguientes métodos de eliminación:

  • La consola de Google Cloud o Google Cloud CLI:

    • Usa la consola o gcloud CLI para borrar los clústeres de usuarios que administra la API de GKE On-Prem. La API de GKE On-Prem administra un clúster de usuario si se cumple alguna de las siguientes condiciones:

  • bmctl:

    • Usa bmctl reset nodes para restablecer nodos específicos.
    • Usa bmctl reset para borrar los siguientes tipos de clústeres:

      • Clústeres independientes, híbridos y de administrador (denominados clústeres de administración automática) Esto incluye los clústeres de administrador administrados por la API de GKE On-Prem.
      • Clústeres de usuario que no son administrados por la API de GKE On-Prem.

    Si usas bmctl para restablecer nodos o borrar un clúster, el comando espera que el archivo de configuración del clúster se encuentre en el directorio de trabajo actual. De forma predeterminada, la ruta de acceso es como la siguiente:

    bmctl-workspace/CLUSTER_NAME/CLUSTER_NAME.yaml

    Si usaste la marca --workspace-dir para especificar un directorio diferente durante la creación del clúster, debes usar la marca para especificar el directorio de trabajo durante el restablecimiento del clúster.

  • kubectl:

    • Usa kubectl delete cluster para borrar solo los clústeres de usuario que no administran los clústeres de la API de GKE On-Prem. No ejecutes el comando en otros tipos de clústeres.
    • Ten en cuenta que, si usas kubectl delete cluster, también debes borrar el espacio de nombres en el que se encuentra el clúster después de borrarlo.

Después de borrar un clúster, puedes volver a instalarlo después de realizar los cambios de configuración necesarios.

Borrar clústeres autoadministrados

Para borrar un clúster de administrador, híbrido o independiente, ejecuta el siguiente comando:

bmctl reset --cluster CLUSTER_NAME

En el comando, reemplaza CLUSTER_NAME por el nombre del clúster que deseas restablecer.

El resultado del comando bmctl cluster reset es similar al siguiente ejemplo:

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

Además de borrar el clúster, el comando borra la membresía del clúster de la flota.

En el caso de los clústeres de administrador administrados por la API de GKE On-Prem, también debes borrar los recursos de la API en Google Cloud. De lo contrario, el clúster se mostrará en la página Clústeres de GKE en la consola de Google Cloud. Usa el siguiente comando para borrar los recursos de la API de GKE On-Prem en un clúster de administrador:

gcloud container bare-metal admin-clusters unenroll CLUSTER_NAME \
    --project=FLEET_HOST_PROJECT_ID \
    --location=REGION \
    --ignore-errors

Reemplaza lo siguiente:

  • FLEET_HOST_PROJECT_ID: El ID del proyecto de la flota en la que era miembro el clúster de administrador

  • REGION: Es la región de Google Cloud en la que la API de GKE On-Prem almacena los metadatos del clúster.

La marca --ignore-errors garantiza que la baja de un recurso de clúster de administrador de equipos físicos se realice de forma correcta incluso si se producen errores durante la baja.

Cuando finalice la eliminación del clúster, puedes crear uno nuevo. Para ver detalles, consulta Descripción general de la creación de clústeres.

Borrar clústeres de usuario

Si la API de GKE On-Prem administra el clúster de usuario, borra el clúster con la consola o gcloud CLI. De lo contrario, usa bmctl o kubectl para borrar el clúster.

bmctl

Puedes usar bmctl para borrar clústeres de usuario que se crearon con bmctl o kubectl, y que no están inscritos en la API de GKE On-Prem.

Ejecuta el siguiente comando para borrar un clúster de usuario con bmctl:

bmctl reset --cluster USER_CLUSTER_NAME --admin-kubeconfig ADMIN_KUBECONFIG_PATH

En el comando, reemplaza las siguientes entradas por información específica de tu entorno:

  • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que deseas borrar.

  • ADMIN_KUBECONFIG_PATH: Es la ruta de acceso al archivo kubeconfig del clúster de administrador asociado. bmctl admite el uso de --kubeconfig como un alias para la marca --admin-kubeconfig.

El resultado del comando bmctl cluster reset es similar al siguiente ejemplo:

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

kubectl

Puedes usar kubectl para borrar clústeres de usuario que se crearon con bmctl o kubectl, y que no estén inscritos en la API de GKE On-Prem. Si deseas usar kubectl para borrar un clúster de usuario, primero debes borrar el objeto de clúster y, luego, su espacio de nombres. De lo contrario, los trabajos para restablecer las máquinas no se pueden crear y el proceso de eliminación puede detenerse de forma indefinida.

Para borrar un clúster de usuario con kubectl, haz lo siguiente:

  1. Ejecuta el siguiente comando para borrar el objeto del clúster:

    kubectl delete cluster USER_CLUSTER_NAME -n USER_CLUSTER_NAMESPACE \
        --kubeconfig ADMIN_KUBECONFIG_PATH
    

    En el comando, reemplaza las siguientes entradas por información específica de tu entorno:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que deseas borrar.

    • USER_CLUSTER_NAMESPACE: es el espacio de nombres para el clúster. De forma predeterminada, los espacios de nombres del clúster para Google Distributed Cloud son el nombre del clúster con el prefijo cluster-. Por ejemplo, si le asignas el nombre test al clúster, el espacio de nombres tiene un nombre como cluster-test.

    • ADMIN_KUBECONFIG_PATH: Es la ruta de acceso al archivo kubeconfig del clúster de administrador asociado.

  2. Después de que el clúster se borre de forma correcta, ejecuta el siguiente comando para borrar el espacio de nombres:

    kubectl delete namespace USER_CLUSTER_NAMESPACE --kubeconfig ADMIN_KUBECONFIG_PATH
    

Console

Si la API de GKE On-Prem administra el clúster de usuario, sigue estos pasos para borrarlo:

  1. En la consola, ve a la página Descripción general de los clústeres de Google Kubernetes Engine.

    Ir a los clústeres de GKE

  2. Selecciona el proyecto de Google Cloud en el que se encuentra el clúster de usuario.

  3. En la lista de clústeres, haz clic en el que deseas editar.

  4. En la lista de clústeres, ubica el que deseas borrar. Si el Tipo es externo, esto indica que el clúster se creó con bmctl y no estaba inscrito en la API de GKE On-Prem. En este caso, sigue los pasos que se indican en la pestaña bmctl o kubectl para borrar el clúster.

    Si el ícono en la columna Estado indica un problema, sigue los pasos en la pestaña de gcloud CLI para borrar el clúster. Deberás agregar la marca --ignore-errors al comando delete.

  5. Haz clic en el nombre del clúster que deseas borrar.

  6. En el panel Details, cerca de la parte superior de la ventana, haz clic en Delete.

  7. Cuando se te solicite confirmar, ingresa el nombre del clúster y haz clic en Quitar.

gcloud CLI

Si la API de GKE On-Prem administra el clúster de usuario, sigue estos pasos para borrar el clúster en una computadora que tenga instalada la CLI de gcloud:

  1. Inicia sesión con tu Cuenta de Google:

    gcloud auth login
    
  2. Actualiza los componentes, como se indica a continuación:

    gcloud components update
    
  3. Obtén una lista de clústeres para asegurarte de especificar el nombre de clúster correcto en el comando delete:

    gcloud container bare-metal clusters list \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION
    

    Reemplaza lo siguiente:

    • FLEET_HOST_PROJECT_ID: Es el ID del proyecto en el que se creó el clúster.

    • LOCATION: Es la ubicación de Google Cloud asociada con el clúster de usuario.

    El resultado es similar al siguiente:

    NAME                      LOCATION    VERSION         ADMIN_CLUSTER            STATE
    example-user-cluster-1a   us-west1    1.29.100-gke.251          example-admin-cluster-1  RUNNING
    
  4. Ejecuta el siguiente comando para borrar el clúster:

    gcloud container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION \
      --force \
      --allow-missing
    

    Reemplaza lo siguiente:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que se borrará.

    • FLEET_HOST_PROJECT_ID: Es el ID del proyecto en el que se creó el clúster.

    • LOCATION: Es la ubicación de Google Cloud asociada con el clúster de usuario.

    La marca --force te permite borrar un clúster que tenga grupos de nodos. Sin la marca --force, primero debes borrar los grupos de nodos y, luego, borrar el clúster.

    La marca --allow-missing es una marca estándar de la API de Google. Cuando incluyes esta marca, el comando muestra éxito si no se encuentra el clúster.

    Si el comando muestra un error que contiene el texto failed connecting to the cluster's control plane, esto indica que hay problemas de conectividad con el clúster de administrador, el agente de Connect o el entorno local. Para solucionar problemas con el agente de Connect, consulta Recopilación de registros del agente de Connect.

    • Si crees que el problema de conectividad es transitorio, por ejemplo, debido a problemas de red, espera y vuelve a ejecutar el comando.

    • Si sabes que se borró el clúster de administrador y si las máquinas de nodos del clúster de administrador o de usuario se apagaron o se desconectaron, incluye la marca --ignore-errors y vuelve a ejecutar el comando.

      También debes incluir --ignore-errors si el clúster se borró con bmctl o kubectl, lo que deja los recursos de la API de GKE On-Prem en Google Cloud. Un síntoma de esto es que el clúster aún se muestra en la página Clústeres de GKE en la consola en mal estado.

Para obtener información sobre otras marcas, consulta la referencia de la CLI de gcloud.

Restablece nodos específicos de un clúster

Es posible que desees restablecer nodos específicos de un clúster si, por ejemplo, se borró un clúster de administrador, pero los clústeres de usuario administrados por ese clúster de administrador se mantienen. En este caso, los clústeres de usuario en su totalidad no se pueden borrar porque se borró el clúster de administrador. Por lo tanto, los nodos de los clústeres de usuario deben restablecerse de forma individual.

Para restablecer los nodos, necesitas una cuenta de servicio con acceso de lectura a Google Container Registry (GCR). El comando bmctl espera el archivo de claves JSON para esta cuenta de servicio como un argumento. Para restablecer los nodos individuales de un clúster, ejecuta el siguiente comando:

bmctl reset nodes --addresses NODE_1_IP_ADDRESS,NODE_2_IP_ADDRESS \
    --ssh-private-key-path SSH_KEY_PATH \
    --gcr-service-account-key SERVICE_ACCOUNT_KEY_PATH \
    --login-user root

En el comando, reemplaza las siguientes entradas por información específica de tu entorno:

  • NODE_1_IP_ADDRESS , NODE_2_IP_ADDRESS: Es la lista separada por comas de las direcciones IP de los nodos que deseas borrar.

  • SSH_KEY_PATH: Es la ruta de acceso a la clave privada SSH. Esta es la clave que se usará para establecer conexiones SSH con los nodos durante el restablecimiento.

  • SERVICE_ACCOUNT_KEY_PATH: Es la ruta de acceso al archivo JSON que contiene la clave de la cuenta de servicio. Esta clave le otorga permiso a bmctl para extraer imágenes de Google Container Registry. Puedes crear una clave de cuenta de servicio con la consola o gcloud CLI. Para obtener más información, consulta Crea y administra claves de cuentas de servicio. Otra forma de crear el archivo de claves de la cuenta de servicio es ejecutar el comando create config con la marca --create-service-accounts. Para obtener detalles sobre ese comando, consulta Crea y administra la configuración del clúster con bmctl.

Detalles de eliminación del clúster

Durante la eliminación, se borran el registro de membresía de la flota del clúster, las activaciones de almacenamiento y los datos de anthos-system StorageClass.

En todos los nodos, se quitan las interfaces de túnel que se usan para las herramientas de redes del clúster y se borran los siguientes directorios:

  • /etc/kubernetes
  • /etc/cni/net.d
  • /root/.kube
  • /var/lib/kubelet

Para los nodos del balanceador de cargas:

  • Se borrarán los servicios keepalived y haproxy.
  • Se borraron los archivos de configuración de keepalived y haproxy.