Soluciona problemas con los clústeres inscritos en la API de GKE On-Prem

En esta página, se muestra cómo investigar problemas para crear un clúster de usuario de GKE on VMware en la consola de Google Cloud.

El clúster de administrador no se muestra en la lista desplegable Aspectos básicos del clúster

El clúster de administrador debe estar registrado en una flota antes de que puedas crear clústeres de usuario en la consola de Google Cloud. Si no ves el clúster de administrador en la lista desplegable en la sección Conceptos básicos del clúster en la consola de Google Cloud, significa que el clúster de administrador no estaba registrado o que se registró con el comando gcloud container hub memberships register.

Comprueba el estado del registro:

  • En la consola de Google Cloud, ve a la página Anthos > Clústeres y selecciona el mismo proyecto de Google Cloud en el que intentaste crear el clúster de usuario.

    Ir a la página Clústeres de GKE Enterprise

    • Si el clúster de administrador no se muestra en la lista, consulta Registra un clúster de administrador.

    • Si el clúster de administrador se muestra en la lista, indica que el clúster se registró con el comando gcloud container hub memberships register. Este comando gcloud no registra de forma correcta los clústeres de administrador.

Para solucionar el problema de registro, sigue estos pasos:

  1. Borra la membresía de la flota del clúster de administrador.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: Es el nombre del clúster de administrador.
    • PROJECT_ID: Es el ID de tu proyecto host de flota. Este es el proyecto que seleccionaste cuando intentaste crear el clúster de usuario en la consola de Google Cloud.
  2. Sigue los pasos en Registra un clúster de administrador para volver a registrarlo.

Errores de creación de clústeres

En esta sección, se describen algunos errores que ocurren durante la creación del clúster en la consola de Google Cloud.

Error de recurso existente

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

Resource 'projects/1234567890/locations/europe-west1/vmwareClusters/user-cluster1'
already exists
Request ID: 129290123128705826

Este mensaje de error indica que el nombre del clúster ya está en uso.

Una solución para solucionar el problema:

  1. Borrar el clúster.

  2. Vuelve a crear el clúster con un nombre que no entre en conflicto con un clúster existente.

Error de los grupos antiafinidad

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Las reglas de antiafinidad de VMware Distributed Resource Scheduler (DRS) requieren al menos 3 hosts físicos en el entorno de vSphere. Para solucionar el problema, inhabilita Grupos de antiafinidad en la sección Funciones de la página Detalles del clúster de tu clúster de la siguiente manera:

  1. En la consola de Google Cloud, ve a la página de clústeres de GKE Enterprise.

    Ir a la página Clústeres de GKE Enterprise

  2. Selecciona el proyecto de Google Cloud en el que se encuentra el clúster de usuario.

  3. En la lista de clústeres, haz clic en el nombre del clúster y, luego, en Ver detalles en el panel Detalles.

  4. En la sección Características, haz clic en Editar.

  5. Desmarca Habilitar grupos antiafinidad y haz clic en Listo.

  6. La consola de Google Cloud muestra el Estado del clúster: cambios en progreso. Haz clic en Mostrar detalles para ver la condición de estado del recurso y los mensajes de estado.

Error de direcciones IP en conflicto

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Por el momento, no puedes editar campos como la VIP del plano de control y la VIP de Ingress en la sección Balanceador de cargas de Página de detalles del clúster en la consola de Google Cloud. Para solucionar los problemas de direcciones IP en conflicto:

  1. Borrar el clúster.

  2. Vuelve a crear el clúster con direcciones IP que no entren en conflicto con un clúster existente.

Quita los clústeres en mal estado

Un clúster puede estar en mal estado por muchos motivos, como los siguientes:

  • Problemas de conectividad con el agente de Connect o el entorno local.

  • Se borró el clúster de administrador de un clúster de usuario, o hay problemas de conectividad entre los clústeres de administrador y de usuario.

  • La VM del clúster se borró antes de borrar el clúster.

Si la consola no puede borrar un clúster, usa los comandos de gcloud CLI para borrar los recursos de Google Cloud de los clústeres en mal estado. Si no actualizaste gcloud CLI recientemente, ejecuta el siguiente comando para actualizar los componentes:

gcloud components update

Luego, borra los recursos de Google Cloud.

Clúster de usuario

  1. Borra el clúster de usuario:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Reemplaza lo siguiente:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que se borrará.

    • PROJECT_ID: El ID del proyecto en el que está registrado el clúster.

    • REGION: Es la ubicación de Google Cloud asociada con el clúster de usuario. La ubicación se muestra en la consola.

      La marca --force te permite borrar un clúster que tenga grupos de nodos. Sin la marca --force, primero debes borrar los grupos de nodos y, luego, borrar el clúster.

      La marca --allow-missing permite que el comando continúe si no se encuentra el clúster.

      --ignore-errors quita los recursos de Google Cloud cuando no se puede acceder a los clústeres de administrador y de usuario. Es posible que queden algunos recursos de F5 o vSphere. Consulta Limpiar recursos para obtener información sobre cómo limpiar los recursos restantes.

      Con este comando, se borra el clúster si existe y se quitan de Google Cloud los recursos de membresía de flota y la API de GKE On-Prem.

  2. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Cuando configuras --location=-, significa que se enumeran todos los clústeres en todas las regiones. Si necesitas reducir el alcance de la lista, establece --location en una región específica.

  3. Confirma que se hayan borrado los recursos de membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Clúster de administrador

  1. Si inscribiste el clúster de administrador en la API de GKE On-Prem, da de baja la inscripción:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing

    Reemplaza lo siguiente:

    • ADMIN_CLUSTER_NAME: Es el nombre del clúster de administrador.
    • PROJECT_ID: El ID del proyecto host de la flota.
    • REGION: Es la región de Google Cloud.

    La marca --allow-missing da de baja el clúster si no se encuentra la membresía de la flota.

    Este comando quita los recursos de la API de GKE On-Prem de Google Cloud.

  2. Quita el clúster de la flota:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Este comando quita de Google Cloud los recursos de membresía de flota.

  3. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID

Cuando configuras --location=-, significa que se enumeran todos los clústeres en todas las regiones. Si necesitas reducir el alcance de la lista, establece --location en una región específica.

  1. Confirma que se hayan borrado los recursos de membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID