Reimpostare i nodi ed eliminare i cluster

Quando un cluster Google Distributed Cloud è in fase di installazione, i binari e i servizi systemd vengono installati sui nodi che ospitano il cluster e i servizi iniziano ad ascoltare le porte sui nodi.

Tuttavia, se l'installazione di un cluster non va a buon fine, tutti questi binari e servizi devono essere eliminati. In altre parole, i nodi devono essere reimpostati o puliti per prepararli a un nuovo tentativo di installazione del cluster. Se i nodi non vengono resettati in questo modo, il successivo tentativo di installare un cluster su di essi non va a buon fine.

Questa pagina descrive come eseguire questa operazione di pulizia di nodi specifici e come eliminare un cluster.

Questa pagina è rivolta ad amministratori, architetti e operatori che gestiscono il ciclo di vita dell'infrastruttura tecnologica sottostante. Per scoprire di più sui ruoli comuni e sulle attività di esempio a cui facciamo riferimento nei contenuti, consulta Ruoli utente e attività comuni di GKE. Google Cloud

Scegli un metodo di eliminazione

Il metodo utilizzato per eliminare un cluster dipende da:

  • Il tipo di cluster.
  • Se vuoi pulire solo nodi specifici e non eliminare l'intero cluster.
  • Come è stato creato il cluster.

Google Distributed Cloud fornisce i seguenti metodi di eliminazione:

  • La console Google Cloud o Google Cloud CLI:

    • Utilizza la console o gcloud CLI per eliminare i cluster utente gestiti dall'API GKE On-Prem. Un cluster utente è gestito dall'API GKE On-Prem se si verifica una delle seguenti condizioni:

      • Il cluster è stato creato nella console Google Cloud o utilizzando gcloud CLI, che configura automaticamente l'API GKE On-Prem per gestire il cluster.

      • Il cluster è stato creato utilizzando bmctl, ma è stato configurato per essere gestito dall'API GKE On-Prem.

  • bmctl:

    • Utilizza bmctl reset nodes per ripristinare nodi specifici.
    • Utilizza bmctl reset per eliminare i seguenti tipi di cluster:

      • Cluster di amministrazione, ibridi e autonomi (denominati cluster autogestiti). Sono inclusi i cluster di amministrazione gestiti dall'API GKE On-Prem.
      • Cluster utente non gestiti dall'API GKE On-Prem.

    Se utilizzi bmctl per reimpostare i nodi o eliminare un cluster, il comando si aspetta che il file di configurazione del cluster si trovi nella directory di lavoro corrente. Per impostazione predefinita, il percorso è simile al seguente:

    bmctl-workspace/CLUSTER_NAME/CLUSTER_NAME.yaml

    Se hai utilizzato il flag --workspace-dir per specificare una directory diversa durante la creazione del cluster, devi utilizzare il flag per specificare la directory di lavoro durante il ripristino del cluster.

  • kubectl:

    • Utilizza kubectl delete cluster per eliminare solo i cluster utente non gestiti dai cluster API GKE On-Prem. Non eseguire il comando su altri tipi di cluster.
    • Tieni presente che se utilizzi kubectl delete cluster, devi eliminare anche lo spazio dei nomi in cui si trova il cluster dopo averlo eliminato.

Dopo aver eliminato un cluster, puoi reinstallarlo dopo aver apportato le modifiche di configurazione necessarie.

Elimina cluster autogestiti

Per eliminare un cluster di amministrazione, ibrido o autonomo, esegui questo comando:

bmctl reset --cluster CLUSTER_NAME

Nel comando, sostituisci CLUSTER_NAME con il nome del cluster che vuoi reimpostare.

L'output del comando bmctl cluster reset è simile a questo esempio:

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

Oltre a eliminare il cluster, il comando elimina l'appartenenza del cluster al parco risorse.

Per i cluster di amministrazione gestiti dall'API GKE On-Prem, devi anche eliminare le risorse API in Google Cloud. In caso contrario, il cluster verrà visualizzato nella pagina Cluster GKE della console Google Cloud . Utilizza questo comando per eliminare le risorse dell'API GKE On-Prem per un cluster di amministrazione:

gcloud container bare-metal admin-clusters unenroll CLUSTER_NAME \
    --project=FLEET_HOST_PROJECT_ID \
    --location=REGION \
    --ignore-errors

Sostituisci quanto segue:

  • FLEET_HOST_PROJECT_ID: L'ID progetto del parco di cui faceva parte il cluster di amministrazione.

  • REGION: La Google Cloud regione in cui l'API GKE On-Prem archivia i metadati del cluster.

Il flag --ignore-errors garantisce che l'annullamento della registrazione di una risorsa cluster di amministrazione bare metal vada a buon fine anche se si verificano errori durante l'annullamento della registrazione.

Al termine dell'eliminazione del cluster, puoi crearne uno nuovo. Per maggiori dettagli, vedi Panoramica della creazione di cluster.

Eliminare i cluster utente

Se il cluster utente è gestito dall'API GKE On-Prem, eliminalo utilizzando la console o gcloud CLI. In caso contrario, utilizza bmctl o kubectl per eliminare il cluster.

bmctl

Puoi utilizzare bmctl per eliminare i cluster utente creati con bmctl o kubectl e che non sono registrati nell'API GKE On-Prem.

Esegui questo comando per eliminare un cluster utente con bmctl:

bmctl reset --cluster USER_CLUSTER_NAME --admin-kubeconfig ADMIN_KUBECONFIG_PATH

Nel comando, sostituisci le seguenti voci con informazioni specifiche per il tuo ambiente:

  • USER_CLUSTER_NAME: il nome del cluster utenti che stai eliminando.

  • ADMIN_KUBECONFIG_PATH: il percorso del file kubeconfig del cluster di amministrazione associato. bmctl supporta l'utilizzo di --kubeconfig come alias per il flag--admin-kubeconfig.

L'output del comando bmctl cluster reset è simile a questo esempio:

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

kubectl

Puoi utilizzare kubectl per eliminare i cluster utente creati con bmctl o kubectl e non registrati nell'API GKE On-Prem. Per utilizzare kubectl per eliminare un cluster utente, devi prima eliminare l'oggetto cluster, poi il relativo spazio dei nomi. In caso contrario, non è possibile creare i job per reimpostare le macchine e la procedura di eliminazione potrebbe bloccarsi a tempo indeterminato.

Per eliminare un cluster utente con kubectl:

  1. Esegui questo comando per eliminare l'oggetto cluster:

    kubectl delete cluster USER_CLUSTER_NAME -n USER_CLUSTER_NAMESPACE \
        --kubeconfig ADMIN_KUBECONFIG_PATH

    Nel comando, sostituisci le seguenti voci con informazioni specifiche per il tuo ambiente:

    • USER_CLUSTER_NAME: il nome del cluster utenti che stai eliminando.

    • USER_CLUSTER_NAMESPACE: lo spazio dei nomi per il cluster. Per impostazione predefinita, gli spazi dei nomi del cluster per Google Distributed Cloud sono il nome del cluster preceduto da cluster-. Ad esempio, se chiami il cluster test, lo spazio dei nomi ha un nome come cluster-test.

    • ADMIN_KUBECONFIG_PATH: il percorso del file kubeconfig del cluster di amministrazione associato.

  2. Dopo l'eliminazione del cluster, esegui questo comando per eliminare lo spazio dei nomi:

    kubectl delete namespace USER_CLUSTER_NAMESPACE --kubeconfig ADMIN_KUBECONFIG_PATH

Console

Se il cluster utente è gestito dall'API GKE On-Prem, segui questi passaggi per eliminare il cluster:

  1. Nella console, vai alla pagina Panoramica dei cluster Google Kubernetes Engine.

    Vai ai cluster GKE

  2. Seleziona il Google Cloud progetto in cui si trova il cluster utente.

  3. Nell'elenco dei cluster, fai clic su quello che vuoi eliminare.

  4. Nell'elenco dei cluster, individua quello che vuoi eliminare. Se il Tipo è esterno, significa che il cluster è stato creato utilizzando bmctl e non è stato registrato nell'API GKE On-Prem. In questo caso, segui i passaggi nella scheda bmctl o kubectl per eliminare il cluster.

    Se l'icona nella colonna Stato indica un problema, segui i passaggi nella scheda gcloud CLI per eliminare il cluster. Devi aggiungere il flag --ignore-errors al comando di eliminazione.

  5. Fai clic sul nome del cluster che vuoi eliminare.

  6. Nel riquadro Dettagli, vicino alla parte superiore della finestra, fai clic su Elimina.

  7. Quando ti viene chiesto di confermare, inserisci il nome del cluster e fai clic su Rimuovi.

Interfaccia a riga di comando gcloud

Se il cluster utente è gestito dall'API GKE On-Prem, segui questi passaggi per eliminare il cluster su un computer su cui è installata la CLI gcloud:

  1. Accedi con il tuo Account Google:

    gcloud auth login
    
  2. Aggiorna i componenti:

    gcloud components update
    
  3. Visualizza un elenco di cluster per assicurarti di specificare il nome del cluster corretto nel comando di eliminazione:

    gcloud container bare-metal clusters list \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION
    

    Sostituisci quanto segue:

    • FLEET_HOST_PROJECT_ID: l'ID del progetto in cui è stato creato il cluster.

    • LOCATION: la Google Cloud posizione associata al cluster utente.

    L'output è simile al seguente:

    NAME                      LOCATION    VERSION         ADMIN_CLUSTER            STATE
    example-user-cluster-1a   us-west1    1.32.200-gke.104          example-admin-cluster-1  RUNNING
    
  4. Esegui questo comando per eliminare il cluster:

    gcloud container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION \
      --force \
      --allow-missing
    

    Sostituisci quanto segue:

    • USER_CLUSTER_NAME: il nome del cluster utenti da eliminare.

    • FLEET_HOST_PROJECT_ID: l'ID del progetto in cui è stato creato il cluster.

    • LOCATION: la Google Cloud posizione associata al cluster utente.

    Il flag --force consente di eliminare un cluster con node pool. Senza il flag --force, devi prima eliminare i pool di nodi e poi eliminare il cluster.

    Il flag --allow-missing è un flag API di Google standard. Se includi questo flag, il comando restituisce esito positivo se il cluster non viene trovato.

    Se il comando restituisce un errore che contiene il testo failed connecting to the cluster's control plane, ciò indica problemi di connettività con il cluster di amministrazione, l'agente Connect o l'ambiente on-premise. Per risolvere i problemi relativi all'agente Connect, consulta Raccolta dei log dell'agente Connect.

    • Se ritieni che il problema di connettività sia temporaneo, ad esempio a causa di problemi di rete, attendi e riprova a eseguire il comando.

    • Se sai che il cluster di amministrazione è stato eliminato o se i nodi delle macchine per il cluster di amministrazione o utente sono stati arrestati o messi offline, includi il flag --ignore-errors e riprova il comando.

      Devi includere anche --ignore-errors se il cluster è stato eliminato utilizzando bmctl o kubectl, il che lascia le risorse dell'API GKE On-Prem in Google Cloud. Uno dei sintomi è che il cluster viene ancora visualizzato nella pagina Cluster GKE della console in uno stato non integro.

Per informazioni sugli altri flag, consulta la documentazione di riferimento di gcloud CLI.

Reimpostare nodi del cluster specifici

Potresti voler reimpostare nodi specifici di un cluster se, ad esempio, un cluster di amministrazione è stato eliminato, ma i cluster utente gestiti da quel cluster di amministrazione rimangono. In questo caso, i cluster utente nel loro complesso non possono essere eliminati perché il cluster di amministrazione è stato eliminato. Di conseguenza, i nodi dei cluster utente devono essere ripristinati singolarmente.

Per reimpostare i nodi, devi disporre di un account di servizio con accesso in lettura ad Artifact Registry. Il comando bmctl prevede il file della chiave JSON per questo account di servizio come argomento. Per reimpostare i singoli nodi di un cluster, esegui questo comando:

bmctl reset nodes --addresses NODE_1_IP_ADDRESS,NODE_2_IP_ADDRESS \
    --ssh-private-key-path SSH_KEY_PATH \
    --gcr-service-account-key SERVICE_ACCOUNT_KEY_PATH \
    --login-user root

Nel comando, sostituisci le seguenti voci con informazioni specifiche per il tuo ambiente:

  • NODE_1_IP_ADDRESS , NODE_2_IP_ADDRESS: elenco di indirizzi IP dei nodi che vuoi eliminare separati da virgole.

  • SSH_KEY_PATH: percorso della chiave privata SSH. Questa è la chiave che verrà utilizzata per stabilire connessioni SSH con i nodi durante il ripristino.

  • SERVICE_ACCOUNT_KEY_PATH: percorso del file JSON contenente la chiave dell'account di servizio. Questa chiave concede a bmctl l'autorizzazione a estrarre immagini da Artifact Registry. Puoi creare una chiave del service account utilizzando la console o gcloud CLI. Per maggiori dettagli, vedi Creare e gestire le account di servizio account. Un altro modo per creare il file della chiave del account di servizio è eseguire il comando create config con il flag --create-service-accounts. Per maggiori dettagli su questo comando, vedi Creare una configurazione del cluster di amministrazione con bmctl.

Dettagli sull'eliminazione del cluster

Durante l'eliminazione, vengono eliminati la registrazione dell'appartenenza al parco del cluster, i montaggi di archiviazione e i dati di anthos-system StorageClass.

Per tutti i nodi, le interfacce tunnel utilizzate per il networking del cluster vengono rimosse e vengono eliminate le seguenti directory:

  • /etc/kubernetes
  • /etc/cni/net.d
  • /root/.kube
  • /var/lib/kubelet

Per i nodi del bilanciatore del carico:

  • I servizi keepalived e haproxy vengono eliminati.
  • I file di configurazione per keepalived e haproxy vengono eliminati.