Réinitialiser des nœuds et supprimer des clusters

Lorsqu'un cluster GKE sur bare metal est en cours d'installation, des binaires et des services systemd sont installés sur les nœuds hébergeant ce cluster, et les services commencent à écouter les ports sur ces nœuds.

Toutefois, en cas d'échec de l'installation d'un cluster, tous ces binaires et services doivent être supprimés. En d'autres termes, les nœuds doivent être réinitialisés ou nettoyés pour les préparer à une nouvelle tentative d'installation du cluster. Si les nœuds ne sont pas réinitialisés de cette manière, la prochaine tentative d'installation d'un cluster échouera.

Cette page explique comment effectuer cette opération de nettoyage de nœuds spécifiques et comment supprimer un cluster.

Choisir une méthode de suppression

La méthode utilisée pour supprimer un cluster dépend des éléments suivants :

  • Le type de cluster.
  • Si vous souhaitez nettoyer uniquement des nœuds spécifiques et non supprimer l'ensemble du cluster.
  • Façon dont le cluster a été créé

GKE sur Bare Metal fournit les méthodes de suppression suivantes:

  • Console Google Cloud ou Google Cloud CLI:

    • Utilisez la console ou la gcloud CLI pour supprimer les clusters d'utilisateur qui sont gérés par l'API GKE On-Prem. Un cluster d'utilisateur est géré par l'API GKE On-Prem si l'une des conditions suivantes est remplie:

      • Le cluster a été créé dans la console Google Cloud ou à l'aide de la gcloud CLI, qui configure automatiquement l'API GKE On-Prem pour gérer le cluster.

      • Le cluster a été créé à l'aide de bmctl, mais il a été configuré pour être géré par l'API GKE On-Prem.

  • bmctl:

    • Utilisez bmctl reset nodes pour réinitialiser des nœuds spécifiques.
    • Utilisez bmctl reset pour supprimer les types de clusters suivants:

      • Clusters d'administrateur, hybrides et autonomes (appelés clusters autogérés). Cela inclut les clusters d'administrateur gérés par l'API GKE On-Prem.
      • Clusters d'utilisateur qui ne sont pas gérés par l'API GKE On-Prem.

    Si vous utilisez bmctl pour réinitialiser des nœuds ou supprimer un cluster, la commande s'attend à ce que le fichier de configuration du cluster se trouve dans le répertoire de travail actuel. Par défaut, le chemin d'accès est semblable à ce qui suit :

    bmctl-workspace/CLUSTER_NAME/CLUSTER_NAME.yaml

    Si vous avez utilisé l'option --workspace-dir pour spécifier un répertoire différent lors de la création du cluster, vous devez également l'utiliser pour spécifier le répertoire de travail lors de la réinitialisation du cluster.

  • kubectl:

    • Utilisez kubectl delete cluster pour ne supprimer que les clusters d'utilisateur qui ne sont pas gérés par les clusters d'API GKE On-Prem. N'exécutez pas la commande sur d'autres types de clusters.
    • Notez que si vous utilisez kubectl delete cluster, vous devez également supprimer l'espace de noms dans lequel se trouve le cluster après la suppression du cluster.

Après avoir supprimé un cluster, vous pouvez le réinstaller après avoir effectué les modifications de configuration nécessaires.

Supprimer des clusters autogérés

Pour supprimer un cluster d'administrateur, hybride ou autonome, exécutez la commande suivante:

bmctl reset --cluster CLUSTER_NAME

Dans la commande, remplacez CLUSTER_NAME par le nom du cluster que vous souhaitez réinitialiser.

Le résultat de la commande bmctl cluster reset ressemble à ceci :

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

En plus de supprimer le cluster, la commande supprime l'appartenance du cluster au parc.

Pour les clusters d'administrateur gérés par l'API GKE On-Prem, vous devez également supprimer les ressources d'API dans Google Cloud. Sinon, le cluster sera affiché sur la page Clusters GKE de la console Google Cloud. Exécutez la commande suivante pour supprimer les ressources de l'API GKE On-Prem pour un cluster d'administrateur:

gcloud container bare-metal admin-clusters unenroll CLUSTER_NAME \
    --project=FLEET_HOST_PROJECT_ID \
    --location=REGION \
    --ignore-errors

Remplacez les éléments suivants :

  • FLEET_HOST_PROJECT_ID: ID du projet du parc dans lequel le cluster d'administrateur appartenait.

  • REGION: région Google Cloud dans laquelle l'API GKE On-Prem stocke les métadonnées du cluster.

L'option --ignore-errors garantit que l'annulation de l'enregistrement d'une ressource de cluster d'administrateur Bare Metal aboutit même si des erreurs se produisent lors du désenregistrement.

Une fois la suppression du cluster terminée, vous pouvez en créer un autre. Pour en savoir plus, consultez la page Présentation de la création de clusters.

Supprimer des clusters d'utilisateur

Si le cluster d'utilisateur est géré par l'API GKE On-Prem, supprimez le cluster à l'aide de la console ou de la gcloud CLI. Sinon, utilisez bmctl ou kubectl pour supprimer le cluster.

bmctl

Vous pouvez utiliser bmctl pour supprimer des clusters d'utilisateur qui ont été créés avec bmctl ou kubectl, et qui ne sont pas enregistrés dans l'API GKE On-Prem.

Exécutez la commande suivante pour supprimer un cluster d'utilisateur avec bmctl :

bmctl reset --cluster USER_CLUSTER_NAME --admin-kubeconfig ADMIN_KUBECONFIG_PATH

Dans la commande, remplacez les entrées suivantes par des informations spécifiques à votre environnement de cluster :

  • USER_CLUSTER_NAME : nom du cluster d'utilisateur que vous supprimez.

  • ADMIN_KUBECONFIG_PATH: chemin d'accès au fichier kubeconfig du cluster d'administrateur associé. bmctl permet d'utiliser --kubeconfig comme alias pour l'option --admin-kubeconfig.

Le résultat de la commande bmctl cluster reset ressemble à ceci :

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

kubectl

Vous pouvez utiliser kubectl pour supprimer des clusters d'utilisateur qui ont été créés avec bmctl ou kubectl, et qui ne sont pas enregistrés dans l'API GKE On-Prem. Pour supprimer un cluster d'utilisateur à l'aide de kubectl, vous devez d'abord supprimer l'objet de cluster, puis son espace de noms. Sinon, les tâches permettant de réinitialiser les machines ne pourront pas être créées, et le processus de suppression risque d'être bloqué indéfiniment.

Pour supprimer un cluster d'utilisateur à l'aide de kubectl, procédez comme suit :

  1. Exécutez la commande suivante pour supprimer l'objet du cluster :

    kubectl delete cluster USER_CLUSTER_NAME -n USER_CLUSTER_NAMESPACE \
        --kubeconfig ADMIN_KUBECONFIG_PATH

    Dans la commande, remplacez les entrées suivantes par des informations spécifiques à votre environnement de cluster :

    • USER_CLUSTER_NAME : nom du cluster d'utilisateur que vous supprimez.

    • USER_CLUSTER_NAMESPACE : espace de noms du cluster. Par défaut, les espaces de noms de cluster pour GKE sur une solution Bare Metal sont le nom du cluster, précédé de cluster-. Par exemple, si vous nommez votre cluster test, l'espace de noms porte un nom tel que cluster-test.

    • ADMIN_KUBECONFIG_PATH: chemin d'accès au fichier kubeconfig du cluster d'administrateur associé.

  2. Une fois le cluster supprimé, exécutez la commande suivante pour supprimer l'espace de noms :

    kubectl delete namespace USER_CLUSTER_NAMESPACE --kubeconfig ADMIN_KUBECONFIG_PATH

Console

Si le cluster d'utilisateur est géré par l'API GKE On-Prem, procédez comme suit pour le supprimer:

  1. Dans la console, accédez à la page de présentation des clusters Google Kubernetes Engine.

    Accéder aux clusters GKE

  2. Sélectionnez le projet Google Cloud dans lequel se trouve le cluster d'utilisateur.

  3. Dans la liste des clusters, cliquez sur le cluster que vous souhaitez modifier.

  4. Dans la liste des clusters, localisez celui que vous souhaitez supprimer. Si le type est externe, cela signifie que le cluster a été créé à l'aide de bmctl et qu'il n'était pas enregistré dans l'API GKE On-Prem. Dans ce cas, suivez les étapes décrites dans l'onglet bmctl ou kubectl pour supprimer le cluster.

    Si l'icône dans la colonne État indique un problème, suivez les étapes décrites dans l'onglet gcloud CLI pour supprimer le cluster. Vous devez ajouter l'option --ignore-errors à la commande de suppression.

  5. Cliquez sur le nom du cluster que vous souhaitez supprimer.

  6. Dans le panneau Details (Détails), en haut de la fenêtre, cliquez sur Delete (Supprimer).

  7. Lorsque vous êtes invité à confirmer votre choix, saisissez le nom du cluster, puis cliquez sur Supprimer.

gcloud CLI

Si le cluster d'utilisateur est géré par l'API GKE On-Prem, procédez comme suit pour supprimer le cluster sur un ordinateur sur lequel la gcloud CLI est installée:

  1. Connectez-vous à votre compte Google :

    gcloud auth login
    
  2. Mettez à jour les composants :

    gcloud components update
    
  3. Obtenez une liste de clusters pour vous assurer de spécifier le nom de cluster approprié dans la commande de suppression:

    gcloud container bare-metal clusters list \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION
    

    Remplacez les éléments suivants :

    • FLEET_HOST_PROJECT_ID: ID du projet dans lequel le cluster a été créé.

    • LOCATION: emplacement Google Cloud associé au cluster d'utilisateur.

    Le résultat ressemble à ce qui suit :

    NAME                      LOCATION    VERSION         ADMIN_CLUSTER            STATE
    example-user-cluster-1a   us-west1    1.28.400-gke.77          example-admin-cluster-1  RUNNING
    
  4. Exécutez la commande suivante pour supprimer le cluster:

    gcloud container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION \
      --force \
      --allow-missing
    

    Remplacez les éléments suivants :

    • USER_CLUSTER_NAME: nom du cluster d'utilisateur à supprimer.

    • FLEET_HOST_PROJECT_ID: ID du projet dans lequel le cluster a été créé.

    • LOCATION: emplacement Google Cloud associé au cluster d'utilisateur.

    L'option --force vous permet de supprimer un cluster contenant des pools de nœuds. Sans l'option --force, vous devez d'abord supprimer les pools de nœuds, puis supprimer le cluster.

    L'option --allow-missing est un indicateur d'API Google standard. Lorsque vous incluez cette option, la commande renvoie un résultat positif si le cluster est introuvable.

    Si la commande renvoie une erreur contenant le texte failed connecting to the cluster's control plane, cela indique des problèmes de connectivité avec le cluster d'administrateur, Connect Agent ou l'environnement sur site. Pour résoudre les problèmes liés à l'agent Connect, consultez la page Collecter les journaux de l'agent Connect.

    • Si vous pensez que le problème de connectivité est temporaire, par exemple en raison de problèmes de réseau, attendez et relancez la commande.

    • Si vous savez que le cluster d'administrateur a été supprimé, ou si les machines de nœud de l'administrateur ou du cluster d'utilisateur ont été arrêtées ou mises hors ligne, incluez l'option --ignore-errors et relancez la commande.

      Vous devez également inclure --ignore-errors si le cluster a été supprimé à l'aide de bmctl ou de kubectl, ce qui laisse les ressources de l'API GKE On-Prem dans Google Cloud. Un symptôme est que le cluster s'affiche toujours sur la page Clusters GKE de la console dans un état non opérationnel.

Pour en savoir plus sur les autres indicateurs, consultez la documentation de référence de gcloud CLI.

Réinitialiser des nœuds de cluster spécifiques

Vous pouvez réinitialiser des nœuds spécifiques d'un cluster si, par exemple, un cluster d'administrateur a été supprimé, mais que les clusters d'utilisateur gérés par ce cluster d'administrateur demeurent. Dans ce cas, les clusters d'utilisateur dans leur ensemble ne peuvent pas être supprimés, car le cluster d'administrateur a été supprimé. Par conséquent, les nœuds des clusters d'utilisateur doivent être réinitialisés individuellement.

Pour réinitialiser les nœuds, vous devez disposer d'un compte de service avec un accès en lecture à Google Container Registry (GCR). La commande bmctl attend le fichier de clé JSON de ce compte de service comme argument. Pour réinitialiser des nœuds individuels d'un cluster, exécutez la commande suivante :

bmctl reset nodes --addresses NODE_1_IP_ADDRESS,NODE_2_IP_ADDRESS \
    --ssh-private-key-path SSH_KEY_PATH \
    --gcr-service-account-key SERVICE_ACCOUNT_KEY_PATH \
    --login-user root

Dans la commande, remplacez les entrées suivantes par des informations spécifiques à votre environnement de cluster :

  • NODE_1_IP_ADDRESS , NODE_2_IP_ADDRESS : liste des adresses IP des nœuds à supprimer, séparées par une virgule.

  • SSH_KEY_PATH : chemin d'accès à la clé privée SSH. Cette clé sera utilisée pour établir des connexions SSH avec les nœuds lors de la réinitialisation.

  • SERVICE_ACCOUNT_KEY_PATH : chemin d'accès au fichier JSON contenant la clé du compte de service. Cette clé accorde à bmctl l'autorisation d'extraire des images de Google Container Registry. Vous pouvez créer une clé de compte de service à l'aide de la console ou de la gcloud CLI. Pour plus d'informations, consultez la page Créer et gérer les clés de comptes de service. Vous pouvez également créer le fichier de clé de compte de service si vous exécutez la commande create config avec l'option --create-service-accounts. Pour en savoir plus sur cette commande, consultez la section Créer et configurer une configuration de cluster d'administrateur avec bmctl.

Détails de la suppression du cluster

Lors de la suppression, l'enregistrement d'appartenance au parc du cluster, les installations de stockage et les données de anthos-system StorageClass sont supprimés.

Pour tous les nœuds, les interfaces de tunnel utilisées pour la mise en réseau des clusters sont supprimées, ainsi que les répertoires suivants :

  • /etc/kubernetes
  • /etc/cni/net.d
  • /root/.kube
  • /var/lib/kubelet

Pour les nœuds d'équilibrage de charge :

  • Les services keepalived et haproxy sont supprimés.
  • Les fichiers de configuration pour keepalived et haproxy sont supprimés.