Risolvi i problemi dei cluster registrati nell'API GKE On-Prem

Questa pagina mostra come esaminare i problemi durante la creazione di un cluster utente Google Distributed Cloud nella console Google Cloud.

L'API GKE On-Prem è un'API ospitata da Google Cloud che ti consente di gestire il ciclo di vita dei tuoi cluster on-premise utilizzando Terraform e gli strumenti standard di Google Cloud. L'API GKE On-Prem viene eseguita nell'infrastruttura di Google Cloud. Terraform, la console Google Cloud e Google Cloud CLI sono client dell'API che utilizzano l'API per creare, aggiornare, eseguire l'upgrade ed eliminare i cluster nel data center. Se hai creato il cluster utilizzando un client standard, il cluster viene registrato nell'API GKE On-Prem, il che significa che puoi utilizzare i client standard per gestire il ciclo di vita del cluster (con alcune eccezioni).

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.

Il cluster di amministrazione non viene visualizzato nell'elenco a discesa Impostazioni di base del cluster

Per poter creare cluster utente nella console Google Cloud, il cluster di amministrazione deve essere registrato in un parco. Se non vedi il cluster di amministrazione nell'elenco a discesa nella sezione Impostazioni di base del cluster della console Google Cloud, significa che il cluster di amministrazione non è stato registrato oppure è stato registrato utilizzando il comando gcloud container fleet memberships register. Questo comando gcloud non registra correttamente i cluster di amministrazione.

Controlla lo stato della registrazione:

  • Nella console Google Cloud, vai alla pagina Anthos > Cluster e seleziona lo stesso progetto Google Cloud in cui hai tentato di creare il cluster utente.

    Vai alla pagina dei cluster GKE Enterprise

    • Se il cluster di amministrazione non è visualizzato nell'elenco, consulta Registrare un cluster di amministrazione.

    • Se il cluster di amministrazione è visualizzato nell'elenco, questo comportamento indica che il cluster è stato registrato utilizzando il comando gcloud container hub memberships register. Questo comando gcloud non registra correttamente i cluster di amministrazione.

Per risolvere il problema di registrazione, completa i seguenti passaggi:

  1. Elimina l'appartenenza al parco risorse del cluster di amministrazione.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del tuo progetto host del parco risorse. Questo è il progetto che hai selezionato quando hai tentato di creare il cluster utente nella console Google Cloud.
  2. Segui i passaggi descritti in Registrare un cluster di amministrazione per registrare di nuovo il cluster.

Errori di creazione del cluster

Questa sezione descrive alcuni errori che si verificano durante la creazione del cluster nella console Google Cloud.

Errore di risorsa già esistente

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Questo messaggio di errore indica che il nome del cluster è già in uso.

Una soluzione per risolvere questo problema è eliminare e ricreare il cluster:

  1. Elimina il cluster.
  2. Crea di nuovo il cluster con un altro nome che non crei conflitti con un cluster esistente.

Errore relativo ai gruppi anti-affinità

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Le regole di anti-affinità di VMware Distributed Resource Scheduler (DRS) richiedono almeno tre host fisici nel tuo ambiente vSphere. Per risolvere il problema, disabilita i gruppi di anti-affinità nella sezione Funzionalità della pagina Dettagli cluster per il tuo cluster, come segue:

  1. Nella console Google Cloud, vai alla pagina dei cluster GKE Enterprise.

    Vai alla pagina dei cluster GKE Enterprise

  2. Seleziona il progetto Google Cloud in cui si trova il cluster utente.

  3. Nell'elenco dei cluster, fai clic sul nome del cluster e quindi su Visualizza dettagli nel riquadro Dettagli.

  4. Nella sezione Funzionalità, fai clic su Modifica.

  5. Deseleziona Attiva gruppi anti-affinità e fai clic su Fine.

  6. Nella console Google Cloud viene visualizzato Stato del cluster: modifiche in corso. Fai clic su Mostra dettagli per visualizzare la condizione di stato della risorsa e i Messaggi di stato.

Errore di indirizzi IP in conflitto

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Non puoi modificare campi come VIP piano di controllo e VIP Ingress nella sezione Bilanciatore del carico della pagina Dettagli cluster della console Google Cloud. Per correggere gli indirizzi IP in conflitto, elimina e ricrea il cluster:

  1. Elimina il cluster.
  2. Crea di nuovo il cluster con indirizzi IP che non siano in conflitto con un cluster esistente.

Rimuovi i cluster in stato non integro

Un cluster può trovarsi in uno stato non integro per molti motivi, tra cui:

  • Problemi di connettività con l'agente Connect o con l'ambiente on-premise.
  • Il cluster di amministrazione per un cluster utente è stato eliminato oppure si sono verificati problemi di connettività tra il cluster di amministrazione e il cluster utente.
  • La VM del cluster è stata eliminata prima dell'eliminazione del cluster.

Se la console non è in grado di eliminare un cluster, utilizza i comandi di gcloud CLI per eliminare le risorse Google Cloud da cluster in stato non integro. Se non hai aggiornato gcloud CLI di recente, esegui questo comando per aggiornare i componenti:

gcloud components update

Dopodiché, elimina le risorse Google Cloud.

Cluster utente

  1. Elimina il cluster utente:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Sostituisci quanto segue:

    • USER_CLUSTER_NAME: il nome del cluster utente da eliminare.

    • PROJECT_ID: l'ID del progetto in cui è registrato il cluster.

    • REGION: la località di Google Cloud associata al cluster utente. La posizione viene visualizzata nella console.

      Il flag --force elimina un cluster che ha pool di nodi. Senza il flag --force, devi prima eliminare i pool di nodi, quindi eliminare il cluster.

      Il flag --allow-missing consente di continuare il comando se il cluster non viene trovato.

      Il flag --ignore-errors rimuove le risorse Google Cloud quando i cluster di amministrazione e utente non sono raggiungibili. Alcune risorse F5 o vSphere potrebbero essere rimaste. Per informazioni sulla pulizia delle risorse rimaste, consulta Pulizia delle risorse.

      Questo comando elimina il cluster se esistente e rimuove sia l'API GKE On-Prem sia le risorse di abbonamento del parco risorse da Google Cloud.

  2. Conferma che le risorse dell'API GKE On-Prem siano state eliminate:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    La configurazione di --location=- consente di elencare tutti i cluster in tutte le regioni. Se devi ridurre l'ambito dell'elenco, imposta --location su una regione specifica.

  3. Verifica che le risorse di appartenenza del parco risorse siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster di amministrazione

  1. Se hai registrato il cluster di amministrazione nell'API GKE On-Prem, annulla la registrazione:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing 
    

    Sostituisci quanto segue:

    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del progetto host del parco risorse.
    • REGION: la regione Google Cloud.

    Il flag --allow-missing annulla la registrazione del cluster se non viene trovata l'appartenenza al parco risorse.

    Questo comando rimuove le risorse dell'API GKE On-Prem da Google Cloud.

  2. Rimuovi il cluster dal parco risorse:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Questo comando rimuove le risorse di appartenenza del parco risorse da Google Cloud.

  3. Conferma che le risorse dell'API GKE On-Prem siano state eliminate:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    La configurazione di --location=- consente di elencare tutti i cluster in tutte le regioni. Se devi ridurre l'ambito dell'elenco, imposta --location su una regione specifica.

  4. Verifica che le risorse di appartenenza del parco risorse siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Passaggi successivi

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.