Risolvi i problemi dei cluster registrati nell'API GKE On-Prem

Questa pagina mostra come esaminare i problemi di creazione di un cluster utente Google Distributed Cloud nella console Google Cloud.

L'API GKE On-Prem è un'API ospitata da Google Cloud che consente di gestire del ciclo di vita dei cluster on-premise utilizzando Terraform e gli strumenti di Google Cloud. L'API GKE On-Prem viene eseguita dell'infrastruttura. Terraform, la console Google Cloud e Google Cloud CLI che utilizzano l'API per creare, aggiornare, eseguire l'upgrade eliminare i cluster nel tuo data center. Se hai creato il cluster utilizzando un client standard, il cluster viene registrato nell'API GKE On-Prem, che puoi utilizzare i client standard per gestire il ciclo di vita del cluster (con alcune eccezioni).

Se hai bisogno di ulteriore assistenza, contatta l'assistenza clienti Google Cloud.

Il cluster di amministrazione non viene visualizzato nell'elenco a discesa Impostazioni di base del cluster

Il cluster di amministrazione deve essere registrato in un flotta prima di poter creare cluster utente in la console Google Cloud. Se non vedi il cluster di amministrazione nell'elenco a discesa della sezione Nozioni di base sui cluster nella console Google Cloud, il cluster di amministrazione non è stato registrato o è stato registrato utilizzando il comando gcloud container fleet memberships register. Questo comando gcloud non registra correttamente i cluster di amministrazione.

Controlla lo stato della registrazione:

  • Nella console Google Cloud, vai a Kubernetes Engine > Cluster e seleziona lo stesso progetto Google Cloud in cui hai tentato di creare l'utente in un cluster Kubernetes.

    Vai alla pagina dei cluster GKE

    • Se il cluster di amministrazione non è visualizzato nell'elenco, consulta Registra un cluster di amministrazione.

    • Se il cluster di amministrazione è visualizzato nell'elenco, questo comportamento indica che il cluster è stato registrato utilizzando il comando gcloud container hub memberships register. Questo comando gcloud non registra correttamente i cluster di amministrazione.

Per risolvere il problema di registrazione, completa i seguenti passaggi:

  1. Elimina l'appartenenza al parco risorse del cluster di amministrazione.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del progetto host del parco risorse. Si tratta del progetto selezionato quando hai tentato di creare il cluster utente nella console Google Cloud.
  2. Segui i passaggi descritti in Registrare un cluster di amministrazione per registrarlo di nuovo.

Errori di creazione del cluster

Questa sezione descrive alcuni errori che si verificano durante la creazione del cluster in nella console Google Cloud.

Errore: la risorsa esiste già

La creazione del cluster di utenti non riesce con un messaggio di errore simile al seguente:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Questo messaggio di errore indica che il nome del cluster è già in uso.

Una soluzione per risolvere il problema consiste nell'eliminare e ricreare il cluster:

  1. Elimina il cluster.
  2. Crea di nuovo il cluster con un altro nome che non sia in conflitto con per il cluster esistente.

Errore relativo ai gruppi anti-affinità

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Le regole di anti-affinità VMware Distributed Resource Scheduler (DRS) richiedono almeno 3 host fisici nel tuo ambiente vSphere. Per risolvere il problema, disattiva Gruppi di anti-affinità nella sezione Funzionalità in Dettagli cluster per il tuo cluster, come segue:

  1. Nella console Google Cloud, vai alla pagina dei cluster GKE.

    Vai alla pagina dei cluster GKE

  2. Seleziona il progetto Google Cloud in cui si trova il cluster utente.

  3. Nell'elenco dei cluster, fai clic sul nome del cluster e quindi su Visualizza dettagli nel riquadro Dettagli.

  4. Nella sezione Funzionalità, fai clic su Modifica.

  5. Deseleziona Attiva gruppi anti-affinità e fai clic su Fine.

  6. La console Google Cloud mostra Stato del cluster: modifiche in corso. Fai clic su Mostra dettagli per visualizzare la condizione dello stato della risorsa e i messaggi di stato.

Errore di indirizzi IP in conflitto

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Non puoi modificare campi come VIP del piano di controllo e Vip Ingress nella sezione Bilanciatore del carico della pagina Dettagli cluster nella console Google Cloud. Per correggere gli indirizzi IP in conflitto, elimina e ricrea il cluster:

  1. Elimina il cluster.
  2. Crea di nuovo il cluster con indirizzi IP che non siano in conflitto con per il cluster esistente.

Rimuovi i cluster in stato non integro

Un cluster può trovarsi in uno stato non integro per molti motivi, tra cui:

  • Problemi di connettività con Connect Agent oppure per l'ambiente on-premise.
  • Il cluster di amministrazione per un cluster utente è stato eliminato oppure è presente connettività e i problemi tra i cluster di amministrazione e i cluster utente.
  • La VM del cluster è stata eliminata prima dell'eliminazione del cluster.

Se la console non è in grado di eliminare un cluster, utilizza Comandi gcloud CLI per eliminare le risorse Google Cloud da in stato non integro. Se non hai aggiornato gcloud CLI di recente, esegui questo comando per aggiornare i componenti:

gcloud components update

Dopodiché, elimina le risorse Google Cloud.

Cluster utente

  1. Elimina il cluster utente:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Sostituisci quanto segue:

    • USER_CLUSTER_NAME: il nome del cluster utente eliminare.

    • PROJECT_ID: l'ID del progetto che in cui è registrato il cluster.

    • REGION: la località di Google Cloud associata a per il cluster utente. La posizione viene visualizzata nella console.

      Il flag --force elimina un cluster che ha pool di nodi. Senza il flag --force, devi prima eliminare i pool di nodi e poi il cluster.

      Il flag --allow-missing consente al comando di continuare se il cluster non viene trovato.

      Il flag --ignore-errors rimuove le risorse Google Cloud quando di amministrazione e utente non sono raggiungibili. Alcune risorse F5 o vSphere potrebbero essere rimaste. Consulta: Esegui la pulizia delle risorse per informazioni sulla pulizia delle risorse rimaste.

      Questo comando elimina il cluster se esiste e rimuove entrambi API GKE On-Prem e risorse di abbonamento del parco risorse di Google Cloud.

  2. Verifica che le risorse dell'API GKE On-Prem siano state eliminate:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Se imposti --location=-, vengono elencati tutti i cluster in tutte le regioni. Se devi restringere l'ambito dell'elenco, imposta --location su una regione specifica.

  3. Verifica che le risorse di adesione al parco siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster di amministrazione

  1. Se hai registrato il cluster di amministrazione nell'API GKE On-Prem, annulla la registrazione:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing 
    

    Sostituisci quanto segue:

    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del progetto host del parco risorse.
    • REGION: la regione Google Cloud.

    Il flag --allow-missing annulla la registrazione del cluster se l'appartenenza al parco risorse non trovato.

    Questo comando rimuove le risorse dell'API GKE On-Prem da Google Cloud.

  2. Rimuovi il cluster dal parco risorse:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Questo comando rimuove le risorse di adesione al parco risorse da Google Cloud.

  3. Verifica che le risorse dell'API GKE On-Prem siano state eliminate:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    L'impostazione di --location=- consente di elencare tutti i cluster in regioni. Se devi restringere l'ambito dell'elenco, imposta --location su un una specifica regione.

  4. Verifica che le risorse di adesione al parco siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Passaggi successivi

Se hai bisogno di ulteriore assistenza, contatta l'assistenza clienti Google Cloud.