Fehlerbehebung bei Clustern, die bei der GKE On-Prem API registriert sind

Auf dieser Seite wird beschrieben, wie Sie Probleme beim Erstellen eines Google Distributed Cloud-Nutzerclusters in der Google Cloud Console untersuchen.

Die GKE On-Prem API ist eine von Google Cloud gehostete API, mit der Sie den Lebenszyklus Ihrer lokalen Cluster mithilfe von Terraform und Google Cloud-Standardtools verwalten können. Die GKE On-Prem API wird in der Infrastruktur von Google Cloud ausgeführt. Terraform, die Google Cloud Console und die Google Cloud CLI sind Clients der API. Sie verwenden die API zum Erstellen, Aktualisieren, Aktualisieren und Löschen von Clustern in Ihrem Rechenzentrum. Wenn Sie den Cluster mit einem Standardclient erstellt haben, wird der Cluster bei der GKE On-Prem API registriert. Das bedeutet, dass Sie (mit einigen Ausnahmen) die Standardclients verwenden können, um den Lebenszyklus des Clusters zu verwalten.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an Cloud Customer Care.

Fehler bei der Clustererstellung

In diesem Abschnitt werden einige Fehler beschrieben, die bei der Clustererstellung in der Google Cloud Console auftreten können.

Fehler: Ressource ist bereits vorhanden

Die Erstellung eines Nutzerclusters schlägt mit einer Fehlermeldung wie der folgenden fehl:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Diese Fehlermeldung gibt an, dass der Clustername bereits verwendet wird.

Eine Lösung, um dieses Problem zu beheben, besteht darin, den Cluster zu löschen und neu zu erstellen:

  1. Löschen Sie den Cluster.
  2. Erstellen Sie den Cluster noch einmal mit einem anderen Namen, der nicht mit einem vorhandenen Cluster in Konflikt steht.

Fehler durch in Konflikt stehende IP-Adressen

Die Erstellung eines Nutzerclusters schlägt mit einer Fehlermeldung wie der folgenden fehl:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Sie können in der Google Cloud Console im Abschnitt Load-Balancer der Seite Clusterdetails keine Felder wie die VIP der Steuerungsebene und die VIP für eingehenden Traffic bearbeiten. Löschen Sie den Cluster und erstellen Sie ihn neu, um widersprüchliche IP-Adressen zu beheben:

  1. Löschen Sie den Cluster.
  2. Erstellen Sie den Cluster noch einmal mit IP-Adressen, die nicht mit einem vorhandenen Cluster in Konflikt stehen.

Fehlerhafte Cluster entfernen

Ein Cluster kann aus vielen Gründen in einen fehlerhaften Zustand versetzt werden, z. B.:

  • Verbindungsprobleme mit dem Connect-Agent oder der lokalen Umgebung.
  • Der Administratorcluster für einen Nutzercluster wurde gelöscht oder es gibt Verbindungsprobleme zwischen dem Administrator- und dem Nutzercluster.

Wenn die Console einen Cluster nicht löschen kann, verwenden Sie die gcloud CLI-Befehle, um Google Cloud-Ressourcen aus fehlerhaften Clustern zu löschen. Wenn Sie die gcloud CLI kürzlich nicht aktualisiert haben, führen Sie den folgenden Befehl aus, um die Komponenten zu aktualisieren:

gcloud components update

Löschen Sie als Nächstes die Google Cloud-Ressourcen.

Nutzercluster

  1. Löschen Sie den Nutzercluster:

    gcloud container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Ersetzen Sie Folgendes:

    • USER_CLUSTER_NAME: Der Name des Nutzerclusters, der gelöscht werden soll.

    • PROJECT_ID: Die ID des Projekts, für das der Cluster registriert ist.

    • REGION: Der Google Cloud-Standort, der dem Nutzercluster zugeordnet ist. Der Standort wird in der Konsole angezeigt.

      Das Flag --force löscht einen Cluster mit Knotenpools. Ohne das Flag --force müssen Sie zuerst die Knotenpools löschen und dann den Cluster löschen.

      Mit dem Flag --allow-missing kann der Befehl fortgesetzt werden, wenn der Cluster nicht gefunden wird.

      Das Flag --ignore-errors entfernt Google Cloud-Ressourcen, wenn die Administrator- und Nutzercluster nicht erreichbar sind.

      Mit diesem Befehl wird der Cluster gelöscht, sofern er vorhanden ist, und sowohl die GKE On-Prem API als auch Ressourcen der Flottenmitgliedschaft aus Google Cloud werden entfernt.

  2. Prüfen Sie, ob die GKE On-Prem API-Ressourcen gelöscht wurden:

    gcloud container bare-metal clusters list \
      --project=PROJECT_ID \
      --location=-

    Wenn Sie --location=- festlegen, werden alle Cluster in allen Regionen aufgelistet. Wenn Sie in der Liste nach unten gehen müssen, legen Sie für --location eine bestimmte Region fest.

  3. Prüfen Sie, ob die Ressourcen für die Flottenmitgliedschaft gelöscht wurden:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Administratorcluster

  1. Wenn Sie den Administratorcluster bei der GKE On-Prem API registriert haben, heben Sie die Registrierung auf:

    gcloud container bare-metal admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing --ignore-errors 
    

    Ersetzen Sie Folgendes:

    • ADMIN_CLUSTER_NAME: Der Name des Administratorclusters.
    • PROJECT_ID: Die ID des Flotten-Hostprojekts.
    • REGION: Die Google Cloud-Region.

    Das Flag --allow-missing hebt die Registrierung des Clusters auf, wenn die Flottenmitgliedschaft nicht gefunden wird.

    Das Flag --ignore-errors entfernt Google Cloud-Ressourcen, wenn die Administrator- und Nutzercluster nicht erreichbar sind.

    Mit diesem Befehl werden die GKE On-Prem API-Ressourcen aus Google Cloud entfernt.

  2. Entfernen Sie den Cluster aus der Flotte:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Mit diesem Befehl werden Ressourcen für die Flottenmitgliedschaft aus Google Cloud entfernt.

  3. Prüfen Sie, ob die GKE On-Prem API-Ressourcen gelöscht wurden:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Wenn Sie --location=- festlegen, werden alle Cluster in allen Regionen aufgelistet. Wenn Sie in der Liste nach unten gehen müssen, legen Sie für --location eine bestimmte Region fest.

  4. Prüfen Sie, ob die Ressourcen für die Flottenmitgliedschaft gelöscht wurden:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Nächste Schritte

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.