Soluciona problemas de los clústeres inscritos en la API de GKE On-Prem

En esta página, se muestra cómo investigar problemas para crear un clúster de usuario de Google Distributed Cloud en la consola de Google Cloud.

La API de GKE On-Prem es una API alojada en Google Cloud que te permite administrar el ciclo de vida de tus clústeres locales con Terraform y las herramientas estándar de Google Cloud. La API de GKE On-Prem se ejecuta en la infraestructura de Google Cloud. Terraform, la consola de Google Cloud y Google Cloud CLI son clientes de la API y la usan para crear, actualizar, actualizar y borrar clústeres de tu centro de datos. Si creaste el clúster con un cliente estándar, este se inscribe en la API de GKE On-Prem, lo que significa que puedes usar los clientes estándar para administrar el ciclo de vida del clúster (con algunas excepciones).

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.

Errores de creación de clústeres

En esta sección, se describen algunos errores que ocurren durante la creación del clúster en la consola de Google Cloud.

Error porque el recurso ya existe

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Este mensaje de error indica que el nombre del clúster ya está en uso.

Una solución para solucionar este problema es borrar el clúster y volver a crearlo:

  1. Borrar el clúster.
  2. Vuelve a crear el clúster con otro nombre que no entre en conflicto con un clúster existente.

Error de direcciones IP en conflicto

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

No puedes editar campos como la VIP del plano de control y la VIP de Ingress en la sección Balanceador de cargas de la página Detalles del clúster en Google Cloud Console. Para corregir las direcciones IP en conflicto, borra y vuelve a crear el clúster:

  1. Borrar el clúster.
  2. Vuelve a crear el clúster con direcciones IP que no entren en conflicto con un clúster existente.

Quita los clústeres en mal estado

Un clúster puede estar en mal estado por muchos motivos, tales como:

  • Problemas de conectividad con el agente de Connect o el entorno local.
  • Se borró el clúster de administrador de un clúster de usuario o hay problemas de conectividad entre los clústeres de administrador y de usuario.

Si la consola no puede borrar un clúster, usa los comandos de gcloud CLI para borrar recursos de Google Cloud de clústeres en mal estado. Si no actualizaste gcloud CLI recientemente, ejecuta el siguiente comando para actualizar los componentes:

gcloud components update

A continuación, borra los recursos de Google Cloud.

Clúster de usuario

  1. Borra el clúster de usuario:

    gcloud container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Reemplaza lo siguiente:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que se borrará.

    • PROJECT_ID: El ID del proyecto en el que está registrado el clúster.

    • REGION: Es la ubicación de Google Cloud asociada con el clúster de usuario. La ubicación se muestra en la consola.

      La marca --force borra un clúster que tenga grupos de nodos. Sin la marca --force, primero debes borrar los grupos de nodos y, luego, borrar el clúster.

      La marca --allow-missing permite que el comando continúe si no se encuentra el clúster.

      La marca --ignore-errors quita los recursos de Google Cloud cuando no se puede acceder a los clústeres de administrador y de usuario.

      Este comando borra el clúster si existe y quita los recursos de membresía de la flota y la API de GKE On-Prem de Google Cloud.

  2. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

    gcloud container bare-metal clusters list \
      --project=PROJECT_ID \
      --location=-

    Cuando configuras --location=-, significa que se enumeran todos los clústeres en todas las regiones. Si necesitas ampliar el alcance de la lista, establece --location en una región específica.

  3. Confirma que se hayan borrado los recursos de membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Clúster de administrador

  1. Si inscribiste el clúster de administrador en la API de GKE On-Prem, anula la inscripción:

    gcloud container bare-metal admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing --ignore-errors 
    

    Reemplaza lo siguiente:

    • ADMIN_CLUSTER_NAME: Es el nombre del clúster de administrador.
    • PROJECT_ID: El ID del proyecto host de la flota.
    • REGION: Es la región de Google Cloud.

    La marca --allow-missing da de baja el clúster si no se encuentra la membresía de la flota.

    La marca --ignore-errors quita los recursos de Google Cloud cuando no se puede acceder a los clústeres de administrador y de usuario.

    Este comando quita los recursos de la API de GKE On-Prem de Google Cloud.

  2. Quita el clúster de la flota:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Este comando quita de Google Cloud los recursos de membresía de la flota.

  3. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Cuando configuras --location=-, significa que se enumeran todos los clústeres en todas las regiones. Si necesitas ampliar el alcance de la lista, establece --location en una región específica.

  4. Confirma que se hayan borrado los recursos de membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

¿Qué sigue?

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.