Risolvi i problemi dei cluster registrati nell'API GKE On-Prem

Questa pagina mostra come esaminare i problemi relativi alla creazione di un cluster utente Google Distributed Cloud nella console Google Cloud.

L'API GKE On-Prem è ospitata da Google Cloud e consente di gestire il ciclo di vita dei cluster on-premise utilizzando Terraform e gli strumenti standard di Google Cloud. L'API GKE On-Prem viene eseguita nell'infrastruttura di Google Cloud. Terraform, la console Google Cloud e Google Cloud CLI sono client dell'API e la utilizzano per creare, aggiornare, eseguire l'upgrade ed eliminare i cluster nel tuo data center. Se hai creato il cluster utilizzando un client standard, il cluster viene registrato nell'API GKE On-Prem, il che significa che puoi utilizzare i client standard per gestire il ciclo di vita del cluster (con alcune eccezioni).

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.

Il cluster di amministrazione non viene visualizzato nell'elenco a discesa Impostazioni di base del cluster

Il cluster di amministrazione deve essere registrato in un parco risorse prima di poter creare cluster utente nella console Google Cloud. Se non vedi il cluster di amministrazione nell'elenco a discesa della sezione Informazioni di base del cluster della console Google Cloud, significa che il cluster di amministrazione non è stato registrato o è stato registrato utilizzando il comando gcloud container fleet memberships register. Questo comando gcloud non registra correttamente i cluster di amministrazione.

Controlla lo stato della registrazione:

  • Nella console Google Cloud, vai alla pagina Anthos > Cluster e seleziona lo stesso progetto Google Cloud in cui hai tentato di creare il cluster utente.

    Vai alla pagina dei cluster GKE Enterprise

    • Se il cluster di amministrazione non è visualizzato nell'elenco, consulta Registrare un cluster di amministrazione.

    • Se il cluster di amministrazione è visualizzato nell'elenco, questo comportamento indica che il cluster è stato registrato utilizzando il comando gcloud container hub memberships register. Questo comando gcloud non registra correttamente i cluster di amministrazione.

Per risolvere il problema di registrazione, completa i seguenti passaggi:

  1. Elimina l'appartenenza al parco risorse del cluster di amministrazione.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del progetto host del parco risorse. Questo è il progetto che hai selezionato quando hai tentato di creare il cluster utente nella console Google Cloud.
  2. Segui i passaggi in Registrare un cluster di amministrazione per registrare nuovamente il cluster.

Errori di creazione del cluster

Questa sezione descrive alcuni errori che si verificano durante la creazione del cluster nella console Google Cloud.

Errore: la risorsa esiste già

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Questo messaggio di errore indica che il nome del cluster è già in uso.

Una soluzione per risolvere questo problema consiste nell'eliminare e ricreare il cluster:

  1. Elimina il cluster.
  2. Crea di nuovo il cluster con un altro nome che non sia in conflitto con un cluster esistente.

Errore dei gruppi anti-affinità

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Le regole di anti-affinità VMware Distributed Resource Scheduler (DRS) richiedono almeno tre host fisici nell'ambiente vSphere. Per risolvere il problema, disabilita Gruppi di anti-affinità nella sezione Funzionalità della pagina Dettagli del cluster per il tuo cluster, come segue:

  1. Nella console Google Cloud, vai alla pagina dei cluster GKE Enterprise.

    Vai alla pagina dei cluster GKE Enterprise

  2. Seleziona il progetto Google Cloud in cui si trova il cluster utente.

  3. Nell'elenco dei cluster, fai clic sul nome del cluster, quindi su Visualizza dettagli nel riquadro Dettagli.

  4. Nella sezione Funzionalità, fai clic su Modifica.

  5. Deseleziona Attiva gruppi anti-affinità e fai clic su Fine.

  6. Nella console Google Cloud viene visualizzato il messaggio Stato del cluster: modifiche in corso. Fai clic su Mostra dettagli per visualizzare la condizione di stato delle risorse e i Messaggi di stato.

Errore di indirizzi IP in conflitto

La creazione del cluster utente non riesce e viene visualizzato un messaggio di errore simile al seguente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Non puoi modificare campi come VIP piano di controllo e VIP in entrata nella sezione Bilanciatore del carico della pagina Dettagli cluster nella console Google Cloud. Per correggere gli indirizzi IP in conflitto, elimina e ricrea il cluster:

  1. Elimina il cluster.
  2. Crea di nuovo il cluster con indirizzi IP che non sono in conflitto con un cluster esistente.

Rimuovi i cluster non integri

Un cluster può avere uno stato non integro per molti motivi, tra cui:

  • Problemi di connettività con l'agente Connect o con l'ambiente on-premise.
  • Il cluster di amministrazione per un cluster utente è stato eliminato o si sono verificati problemi di connettività tra il cluster di amministrazione e il cluster utente.
  • La VM del cluster è stata eliminata prima dell'eliminazione del cluster.

Se la console non è in grado di eliminare un cluster, utilizza i comandi gcloud CLI per eliminare le risorse Google Cloud dai cluster non integri. Se di recente non hai aggiornato gcloud CLI, esegui questo comando per aggiornare i componenti:

gcloud components update

Quindi, elimina le risorse Google Cloud.

Cluster utente

  1. Elimina il cluster utente:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Sostituisci quanto segue:

    • USER_CLUSTER_NAME: il nome del cluster utente da eliminare.

    • PROJECT_ID: l'ID del progetto in cui è registrato il cluster.

    • REGION: la località Google Cloud associata al cluster utente. La località viene visualizzata nella console.

      Il flag --force elimina un cluster che dispone di pool di nodi. Senza il flag --force, devi prima eliminare i pool di nodi, quindi eliminare il cluster.

      Il flag --allow-missing consente di proseguire il comando anche se il cluster non viene trovato.

      Il flag --ignore-errors rimuove le risorse Google Cloud quando i cluster di amministrazione e utente non sono raggiungibili. Alcune risorse F5 o vSphere potrebbero essere rimaste. Consulta Pulizia delle risorse per informazioni su come eliminare le risorse rimaste.

      Questo comando elimina il cluster, se esistente, e rimuove da Google Cloud le risorse dell'API GKE On-Prem e dell'abbonamento del parco risorse.

  2. Conferma che le risorse dell'API GKE On-Prem sono state eliminate:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Quando imposti --location=-, significa che vengono elencati tutti i cluster in tutte le regioni. Se devi limitare l'elenco, imposta --location su una regione specifica.

  3. Verifica che le risorse dell'abbonamento del parco risorse siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster di amministrazione

  1. Se hai registrato il cluster di amministrazione nell'API GKE On-Prem, annulla la registrazione:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing 
    

    Sostituisci quanto segue:

    • ADMIN_CLUSTER_NAME: il nome del cluster di amministrazione.
    • PROJECT_ID: l'ID del progetto host del parco risorse.
    • REGION: la regione Google Cloud.

    Il flag --allow-missing annulla la registrazione del cluster se non viene trovata l'appartenenza al parco risorse.

    Questo comando rimuove le risorse dell'API GKE On-Prem da Google Cloud.

  2. Rimuovi il cluster dal parco risorse:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Questo comando rimuove le risorse dell'abbonamento del parco risorse da Google Cloud.

  3. Conferma che le risorse dell'API GKE On-Prem sono state eliminate:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Quando imposti --location=-, significa che vengono elencati tutti i cluster in tutte le regioni. Se devi limitare l'elenco, imposta --location su una regione specifica.

  4. Verifica che le risorse dell'abbonamento del parco risorse siano state eliminate:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Passaggi successivi

Se hai bisogno di ulteriore aiuto, contatta l'assistenza clienti Google Cloud.