Soluciona problemas de los clústeres inscritos en la API de GKE On-Prem

En esta página, se muestra cómo investigar problemas en la creación de un clúster de usuario de Google Distributed Cloud Virtual for VMware en la consola de Google Cloud.

La API de GKE On-Prem es una API alojada en Google Cloud que te permite administrar el ciclo de vida de tus clústeres locales con Terraform y las herramientas estándar de Google Cloud. La API de GKE On-Prem se ejecuta en la infraestructura de Google Cloud. Terraform, la consola de Google Cloud y Google Cloud CLI son clientes de la API y la usan para crear, actualizar, actualizar y borrar clústeres de tu centro de datos. Si creaste el clúster con un cliente estándar, este se inscribe en la API de GKE On-Prem, lo que significa que puedes usar los clientes estándar para administrar el ciclo de vida del clúster (con algunas excepciones).

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.

El clúster de administrador no se muestra en la lista desplegable Aspectos básicos del clúster

El clúster de administrador debe estar registrado en una flota antes de que puedas crear clústeres de usuario en la consola de Google Cloud. Si no ves el clúster de administrador en la lista desplegable en la sección Conceptos básicos del clúster en la consola de Google Cloud, significa que el clúster de administrador no estaba registrado o que se registró con el comando gcloud container fleet memberships register. Este comando gcloud no registra correctamente los clústeres de administrador.

Comprueba el estado del registro:

  • En la consola de Google Cloud, ve a la página Anthos > Clústeres y selecciona el mismo proyecto de Google Cloud en el que intentaste crear el clúster de usuario.

    Ir a la página Clústeres de GKE Enterprise

    • Si el clúster de administrador no se muestra en la lista, consulta Registra un clúster de administrador.

    • Si el clúster de administrador aparece en la lista, este comportamiento indica que el clúster se registró con el comando gcloud container hub memberships register. Este comando gcloud no registra de forma correcta los clústeres de administrador.

Para solucionar el problema de registro, completa los siguientes pasos:

  1. Borra la membresía de la flota del clúster de administrador.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: Es el nombre del clúster de administrador.
    • PROJECT_ID: Es el ID del proyecto host de la flota. Este es el proyecto que seleccionaste cuando intentaste crear el clúster de usuario en la consola de Google Cloud.
  2. Sigue los pasos en Registra un clúster de administrador para volver a registrarlo.

Errores de creación de clústeres

En esta sección, se describen algunos errores que ocurren durante la creación del clúster en la consola de Google Cloud.

Error porque el recurso ya existe

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Este mensaje de error indica que el nombre del clúster ya está en uso.

Una solución para solucionar este problema es borrar el clúster y volver a crearlo:

  1. Borra el clúster.
  2. Vuelve a crear el clúster con otro nombre que no entre en conflicto con un clúster existente.

Error de los grupos antiafinidad

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Las reglas de antiafinidad de VMware Distributed Resource Scheduler (DRS) requieren al menos 3 hosts físicos en el entorno de vSphere. Para solucionar el problema, inhabilita Grupos de antiafinidad en la sección Funciones de la página Detalles del clúster de tu clúster de la siguiente manera:

  1. En la consola de Google Cloud, ve a la página de clústeres de GKE Enterprise.

    Ir a la página Clústeres de GKE Enterprise

  2. Selecciona el proyecto de Google Cloud en el que se encuentra el clúster de usuario.

  3. En la lista de clústeres, haz clic en el nombre del clúster y, luego, en Ver detalles en el panel Detalles.

  4. En la sección Características, haz clic en Editar.

  5. Desmarca Habilitar grupos antiafinidad y haz clic en Listo.

  6. La consola de Google Cloud muestra el Estado del clúster: cambios en progreso. Haz clic en Mostrar detalles para ver la condición de estado del recurso y los mensajes de estado.

Error de direcciones IP en conflicto

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

No puedes editar campos como la VIP del plano de control y la VIP de Ingress en la sección Balanceador de cargas de la página Detalles del clúster en Google Cloud Console. Para corregir las direcciones IP en conflicto, borra y vuelve a crear el clúster:

  1. Borra el clúster.
  2. Vuelve a crear el clúster con direcciones IP que no entren en conflicto con un clúster existente.

Quita los clústeres en mal estado

Un clúster puede estar en mal estado por muchos motivos, tales como:

  • Problemas de conectividad con el agente de Connect o el entorno local.
  • Se borró el clúster de administrador de un clúster de usuario o hay problemas de conectividad entre los clústeres de administrador y de usuario.
  • La VM del clúster se borró antes de borrar el clúster.

Si la consola no puede borrar un clúster, usa los comandos de gcloud CLI para borrar recursos de Google Cloud de clústeres en mal estado. Si no actualizaste gcloud CLI recientemente, ejecuta el siguiente comando para actualizar los componentes:

gcloud components update

A continuación, borra los recursos de Google Cloud.

Clúster de usuario

  1. Borra el clúster de usuario:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Reemplaza lo siguiente:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que se borrará.

    • PROJECT_ID: El ID del proyecto en el que está registrado el clúster.

    • REGION: Es la ubicación de Google Cloud asociada con el clúster de usuario. La ubicación se muestra en la consola.

      La marca --force borra un clúster que tenga grupos de nodos. Sin la marca --force, primero debes borrar los grupos de nodos y, luego, borrar el clúster.

      La marca --allow-missing permite que el comando continúe si no se encuentra el clúster.

      La marca --ignore-errors quita los recursos de Google Cloud cuando no se puede acceder a los clústeres de administrador y de usuario. Es posible que queden algunos recursos de F5 o vSphere. Consulta Limpiar recursos para obtener información sobre cómo limpiar los recursos restantes.

      Este comando borra el clúster si existe y quita los recursos de membresía de la flota y la API de GKE On-Prem de Google Cloud.

  2. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Cuando configuras --location=-, significa que se enumeran todos los clústeres en todas las regiones. Si necesitas ampliar el alcance de la lista, establece --location en una región específica.

  3. Confirma que se hayan borrado los recursos de membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Clúster de administrador

  1. Si inscribiste el clúster de administrador en la API de GKE On-Prem, anula la inscripción:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing
    

    Reemplaza lo siguiente:

    • ADMIN_CLUSTER_NAME: Es el nombre del clúster de administrador.
    • PROJECT_ID: El ID del proyecto host de la flota.
    • REGION: Es la región de Google Cloud.

    La marca --allow-missing da de baja el clúster si no se encuentra la membresía de la flota.

    Este comando quita los recursos de la API de GKE On-Prem de Google Cloud.

  2. Quita el clúster de la flota:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Este comando quita de Google Cloud los recursos de membresía de la flota.

  3. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Cuando configuras --location=-, significa que se enumeran todos los clústeres en todas las regiones. Si necesitas ampliar el alcance de la lista, establece --location en una región específica.

  4. Confirma que se hayan borrado los recursos de membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

¿Qué sigue?

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.