Risolvere i problemi relativi ai cluster registrati nell'API GKE On-Prem

Questa pagina mostra come esaminare i problemi relativi alla creazione di un cluster utente GKE su VMware nella console Google Cloud.

Il cluster di amministrazione non viene visualizzato nell'elenco a discesa Informazioni di base sul cluster

Il cluster di amministrazione deve essere registrato in un parco risorse prima di poter creare cluster utente nella console Google Cloud. Se non vedi il cluster di amministrazione nell'elenco a discesa della sezione Nozioni di base sul cluster della console Google Cloud, significa che il cluster di amministrazione non è stato registrato o è stato registrato utilizzando il comando gcloud container hub memberships register.

Controlla lo stato della registrazione:

  • Nella console Google Cloud, vai alla pagina Anthos > Cluster e seleziona lo stesso progetto Google Cloud in cui hai tentato di creare il cluster utente.

    Vai alla pagina dei cluster GKE Enterprise

    • Se il cluster di amministrazione non è visualizzato nell'elenco, consulta Registrare un cluster di amministrazione.

    • Se il cluster di amministrazione è visualizzato nell'elenco, significa che il cluster è stato registrato utilizzando il comando gcloud container hub memberships register. Questo comando gcloud non registra correttamente i cluster di amministrazione.

Per risolvere il problema di registrazione:

  1. Elimina l'appartenenza al parco risorse del cluster di amministrazione.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del progetto host del parco risorse. Questo è il progetto che hai selezionato quando hai tentato di creare il cluster utente nella console Google Cloud.
  2. Segui i passaggi descritti in Registrare un cluster di amministrazione per registrare nuovamente il cluster.

Errori di creazione del cluster

Questa sezione descrive alcuni errori che si verificano durante la creazione del cluster nella console Google Cloud.

Errore di risorsa già esistente

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

Resource 'projects/1234567890/locations/europe-west1/vmwareClusters/user-cluster1'
already exists
Request ID: 129290123128705826

Questo messaggio di errore indica che il nome del cluster è già in uso.

Una soluzione per risolvere il problema:

  1. Elimina il cluster.

  2. Crea di nuovo il cluster con un altro nome che non sia in conflitto con un cluster esistente.

Errore dei gruppi anti-affinità

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Le regole di anti-affinità VMware Distributed Resource Scheduler (DRS) richiedono almeno tre host fisici nell'ambiente vSphere. Per risolvere il problema, disabilita Gruppi di affinità nella sezione Funzionalità della pagina Dettagli cluster per il tuo cluster, come segue:

  1. Nella console Google Cloud, vai alla pagina Cluster GKE Enterprise.

    Vai alla pagina dei cluster GKE Enterprise

  2. Seleziona il progetto Google Cloud in cui si trova il cluster utente.

  3. Nell'elenco dei cluster, fai clic sul nome del cluster, quindi su Visualizza dettagli nel riquadro Dettagli.

  4. Nella sezione Funzionalità, fai clic su Modifica.

  5. Deseleziona Attiva gruppi anti-affinità e fai clic su Fine.

  6. Nella console Google Cloud viene visualizzato lo stato del cluster: modifiche in corso. Fai clic su Mostra dettagli per visualizzare la condizione di stato delle risorse e i Messaggi di stato.

Errore di indirizzi IP in conflitto

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Al momento, non puoi modificare campi come Vip piano di controllo e Vip Ingress nella sezione Bilanciatore del carico della pagina Dettagli cluster nella console Google Cloud. Per correggere gli indirizzi IP in conflitto:

  1. Elimina il cluster.

  2. Crea di nuovo il cluster con indirizzi IP che non siano in conflitto con un cluster esistente.

Rimuovi i cluster non integri

Un cluster può avere uno stato non integro per molti motivi, tra cui:

  • Problemi di connettività con l'agente Connect o con l'ambiente on-premise.

  • Il cluster di amministrazione per un cluster utente è stato eliminato o si sono verificati problemi di connettività tra i cluster di amministrazione e i cluster utente.

  • La VM del cluster è stata eliminata prima dell'eliminazione del cluster.

Se la console non riesce a eliminare un cluster, utilizza i comandi gcloud CLI per eliminare le risorse Google Cloud dai cluster non integri. Se non hai aggiornato gcloud CLI di recente, esegui questo comando per aggiornare i componenti:

gcloud components update

Quindi, elimina le risorse Google Cloud.

Cluster utente

  1. Elimina il cluster utente:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Sostituisci quanto segue:

    • USER_CLUSTER_NAME: il nome del cluster utente da eliminare.

    • PROJECT_ID: l'ID del progetto in cui è registrato il cluster.

    • REGION: la località Google Cloud associata al cluster utente. La località viene visualizzata nella console.

      Il flag --force consente di eliminare un cluster con pool di nodi. Senza il flag --force, devi prima eliminare i pool di nodi, quindi eliminare il cluster.

      Il flag --allow-missing consente al comando di continuare se il cluster non viene trovato.

      --ignore-errors rimuove le risorse Google Cloud quando i cluster di amministrazione e utente non sono raggiungibili. Alcune risorse F5 o vSphere potrebbero essere rimaste. Consulta Pulizia delle risorse per informazioni sulla pulizia delle risorse rimaste.

      Questo comando elimina il cluster se esistente e rimuove l'API GKE On-Prem e le risorse di abbonamento del parco risorse da Google Cloud.

  2. Conferma che le risorse dell'API GKE On-Prem sono state eliminate:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Se imposti --location=-, vengono elencati tutti i cluster in tutte le regioni. Se devi restringere l'elenco, imposta --location su una regione specifica.

  3. Verifica che le risorse di appartenenza del parco risorse siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster di amministrazione

  1. Se hai registrato il cluster di amministrazione nell'API GKE On-Prem, annulla la registrazione:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing

    Sostituisci quanto segue:

    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del progetto host del parco risorse.
    • REGION: la regione Google Cloud.

    Il flag --allow-missing annulla la registrazione del cluster se non viene trovata l'appartenenza al parco risorse.

    Questo comando rimuove le risorse dell'API GKE On-Prem da Google Cloud.

  2. Rimuovi il cluster dal parco risorse:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Questo comando rimuove le risorse di appartenenza del parco risorse da Google Cloud.

  3. Conferma che le risorse dell'API GKE On-Prem sono state eliminate:

gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID

Quando imposti --location=-, vengono elencati tutti i cluster in tutte le regioni. Se devi restringere l'elenco, imposta --location su una regione specifica.

  1. Verifica che le risorse di appartenenza del parco risorse siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID