Solucionar problemas de clústeres registrados en la API de GKE On-Prem

En esta página se explica cómo investigar problemas al crear un clúster de usuario de Google Distributed Cloud en la Google Cloud consola.

La API de GKE On-Prem es una API alojada en Google Cloud que te permite gestionar el ciclo de vida de tus clústeres on-premise con Terraform y herramientas estándar.Google Cloud La API GKE On-Prem se ejecuta en la infraestructura de Google Cloud. Terraform, la Google Cloud consola y la CLI de Google Cloud son clientes de la API y la usan para crear, actualizar, mejorar y eliminar clústeres en tu centro de datos. Si has creado el clúster con un cliente estándar, el clúster se registra en la API de GKE On-Prem, lo que significa que puedes usar los clientes estándar para gestionar el ciclo de vida del clúster (con algunas excepciones).

Errores de creación de clústeres

En esta sección se describen algunos errores que se producen durante la creación de clústeres en la consolaGoogle Cloud .

Error "El recurso ya existe"

Se produce un error al crear un clúster de usuario y se muestra un mensaje similar al siguiente:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Este mensaje de error indica que el nombre del clúster ya está en uso.

Una solución para solucionar este problema es eliminar el clúster y volver a crearlo:

  1. Elimina el clúster.
  2. Vuelve a crear el clúster con otro nombre que no entre en conflicto con un clúster ya creado.

Error de direcciones IP en conflicto

Se produce un error al crear un clúster de usuario y se muestra un mensaje similar al siguiente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

No puedes editar campos como VIP del plano de control y VIP de entrada en la sección Balanceador de carga de la página Detalles del clúster de la consolaGoogle Cloud . Para solucionar los conflictos de direcciones IP, elimina y vuelve a crear el clúster:

  1. Elimina el clúster.
  2. Vuelve a crear el clúster con direcciones IP que no entren en conflicto con un clúster ya creado.

Eliminar clústeres incorrectos

Un clúster puede estar en mal estado por muchos motivos, como los siguientes:

  • Problemas de conectividad con el agente de conexión o con el entorno local.
  • Se ha eliminado el clúster de administrador de un clúster de usuarios o hay problemas de conectividad entre los clústeres de administrador y de usuarios.

Si la consola no puede eliminar un clúster, usa los comandos de la CLI de gcloud para eliminar los recursos de los clústeres que no estén en buen estado. Google Cloud Si no has actualizado la CLI de gcloud recientemente, ejecuta el siguiente comando para actualizar los componentes:

gcloud components update

A continuación, elimina los Google Cloud recursos.

Clúster de usuarios

  1. Elimina el clúster de usuarios:

    gcloud container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Haz los cambios siguientes:

    • USER_CLUSTER_NAME: nombre del clúster de usuarios que se va a eliminar.

    • PROJECT_ID: el ID del proyecto en el que está registrado el clúster.

    • REGION: la Google Cloud ubicación asociada al clúster de usuarios. La ubicación se muestra en la consola.

      La marca --force elimina un clúster que tiene grupos de nodos. Si no usas la marca --force, primero debes eliminar los grupos de nodos y, después, el clúster.

      La marca --allow-missing permite que el comando continúe si no se encuentra el clúster.

      La marca --ignore-errors elimina Google Cloud recursos cuando no se puede acceder a los clústeres de administrador y de usuario.

      Este comando elimina el clúster si existe y quita los recursos de la API de GKE On-Prem y de la pertenencia a la flota de Google Cloud.

  2. Confirma que se han eliminado los recursos de la API de GKE On-Prem:

    gcloud container bare-metal clusters list \
      --project=PROJECT_ID \
      --location=-

    Si define --location=-, se mostrarán todos los clústeres de todas las regiones. Si necesitas acotar la lista, define --location en una región específica.

  3. Confirma que se han eliminado los recursos de la pertenencia a la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Clúster de administradores

  1. Si has registrado el clúster de administrador en la API de GKE On-Prem, anula el registro:

    gcloud container bare-metal admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing --ignore-errors 
    

    Haz los cambios siguientes:

    • ADMIN_CLUSTER_NAME: nombre del clúster de administrador.
    • PROJECT_ID: ID del proyecto host de la flota.
    • REGION: la Google Cloud región.

    La marca --allow-missing anula el registro del clúster si no se encuentra la pertenencia a la flota.

    La marca --ignore-errors elimina los recursosGoogle Cloud cuando no se puede acceder a los clústeres de administrador y de usuario.

    Este comando elimina los recursos de la API de GKE On-Prem de Google Cloud.

  2. Quita el clúster de la flota:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Este comando quita los recursos de pertenencia a la flota de Google Cloud.

  3. Confirma que se han eliminado los recursos de la API de GKE On-Prem:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Si define --location=-, se mostrarán todos los clústeres de todas las regiones. Si necesitas acotar la lista, define --location en una región específica.

  4. Confirma que se han eliminado los recursos de la pertenencia a la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Siguientes pasos

Si necesitas más ayuda, ponte en contacto con el servicio de atención al cliente de Cloud. También puedes consultar la sección Obtener asistencia para obtener más información sobre los recursos de asistencia, incluidos los siguientes:

  • Requisitos para abrir un caso de asistencia.
  • Herramientas para ayudarte a solucionar problemas, como la configuración de tu entorno, los registros y las métricas.
  • Componentes admitidos.