Réinitialiser des nœuds et supprimer des clusters

Lorsqu'un cluster Google Distributed Cloud est en cours d'installation, des binaires et des services systemd sont installés sur les nœuds hébergeant ce cluster, et les services commencent à écouter les ports des nœuds.

Toutefois, en cas d'échec de l'installation d'un cluster, tous ces binaires et services doivent être supprimés. En d'autres termes, les nœuds doivent être réinitialisés ou nettoyés pour les préparer à une nouvelle tentative d'installation du cluster. Si les nœuds ne sont pas réinitialisés de cette manière, la prochaine tentative d'installation d'un cluster échouera.

Cette page explique comment effectuer cette opération de nettoyage de nœuds spécifiques et comment supprimer un cluster.

Choisir une méthode de suppression

La méthode utilisée pour supprimer un cluster dépend des éléments suivants :

  • Le type de cluster.
  • Si vous souhaitez ne nettoyer que des nœuds spécifiques et ne pas supprimer l'ensemble du cluster
  • La façon dont le cluster a été créé

Google Distributed Cloud fournit les méthodes de suppression suivantes:

  • La console Google Cloud ou la Google Cloud CLI:

    • Utilisez la console ou la gcloud CLI pour supprimer des clusters d'utilisateur gérés par l'API GKE On-Prem. Un cluster d'utilisateur est géré par l'API GKE On-Prem si l'une des conditions suivantes est remplie:

      • Le cluster a été créé dans la console Google Cloud ou à l'aide de la gcloud CLI, qui configure automatiquement l'API GKE On-Prem pour gérer le cluster.

      • Le cluster a été créé à l'aide de bmctl, mais il a été configuré pour être géré par l'API GKE On-Prem.

  • bmctl:

    • Utilisez bmctl reset nodes pour réinitialiser des nœuds spécifiques.
    • Utilisez bmctl reset pour supprimer les types de clusters suivants:

      • Clusters administrateur, clusters hybrides et autonomes (appelés clusters autogérés). Cela inclut les clusters d'administrateur gérés par l'API GKE On-Prem.
      • Clusters d'utilisateur non gérés par l'API GKE On-Prem.

    Si vous utilisez bmctl pour réinitialiser des nœuds ou supprimer un cluster, la commande s'attend à ce que le fichier de configuration du cluster se trouve dans le répertoire de travail actuel. Par défaut, le chemin d'accès est semblable à ce qui suit :

    bmctl-workspace/CLUSTER_NAME/CLUSTER_NAME.yaml

    Si vous avez utilisé l'option --workspace-dir pour spécifier un répertoire différent lors de la création du cluster, vous devez également l'utiliser pour spécifier le répertoire de travail lors de la réinitialisation du cluster.

  • kubectl:

    • Utilisez kubectl delete cluster pour ne supprimer que les clusters d'utilisateur qui ne sont pas gérés par les clusters de l'API GKE On-Prem. N'exécutez pas la commande sur d'autres types de clusters.
    • Notez que si vous utilisez kubectl delete cluster, vous devez également supprimer l'espace de noms dans lequel se trouve le cluster après l'avoir supprimé.

Après avoir supprimé un cluster, vous pouvez le réinstaller après avoir effectué les modifications de configuration nécessaires.

Supprimer les clusters autogérés

Pour supprimer un cluster d'administrateur, hybride ou autonome, exécutez la commande suivante:

bmctl reset --cluster CLUSTER_NAME

Dans la commande, remplacez CLUSTER_NAME par le nom du cluster que vous souhaitez réinitialiser.

Le résultat de la commande bmctl cluster reset ressemble à ceci :

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

En plus de supprimer le cluster, la commande supprime l'appartenance au cluster du parc.

Pour les clusters d'administrateur gérés par l'API GKE On-Prem, vous devez également supprimer les ressources d'API dans Google Cloud. Sinon, le cluster sera affiché sur la page Clusters GKE de la console Google Cloud. Utilisez la commande suivante pour supprimer les ressources de l'API GKE On-Prem pour un cluster d'administrateur:

gcloud container bare-metal admin-clusters unenroll CLUSTER_NAME \
    --project=FLEET_HOST_PROJECT_ID \
    --location=REGION \
    --ignore-errors

Remplacez les éléments suivants :

  • FLEET_HOST_PROJECT_ID: ID de projet du parc dont le cluster d'administrateur était membre.

  • REGION: région Google Cloud dans laquelle l'API GKE On-Prem stocke les métadonnées du cluster.

L'option --ignore-errors garantit que la désinscription d'une ressource de cluster d'administrateur Bare Metal aboutit, même si des erreurs se produisent lors de la désinscription.

Une fois la suppression du cluster terminée, vous pouvez en créer un autre. Pour en savoir plus, consultez la page Présentation de la création de clusters.

Supprimer des clusters d'utilisateur

Si le cluster d'utilisateur est géré par l'API GKE On-Prem, supprimez-le à l'aide de la console ou de gcloud CLI. Sinon, utilisez bmctl ou kubectl pour supprimer le cluster.

bmctl

Vous pouvez utiliser bmctl pour supprimer des clusters d'utilisateur créés avec bmctl ou kubectl et qui ne sont pas enregistrés dans l'API GKE On-Prem.

Exécutez la commande suivante pour supprimer un cluster d'utilisateur avec bmctl :

bmctl reset --cluster USER_CLUSTER_NAME --admin-kubeconfig ADMIN_KUBECONFIG_PATH

Dans la commande, remplacez les entrées suivantes par des informations spécifiques à votre environnement de cluster :

  • USER_CLUSTER_NAME : nom du cluster d'utilisateur que vous supprimez.

  • ADMIN_KUBECONFIG_PATH: chemin d'accès au fichier kubeconfig du cluster d'administrateur associé. bmctl permet d'utiliser --kubeconfig comme alias pour l'option --admin-kubeconfig.

Le résultat de la commande bmctl cluster reset ressemble à ceci :

Please check the logs at bmctl-workspace/example-cluster-1/log/reset-20221025-184705/reset.log
[2022-10-25 18:47:11+0000] Creating bootstrap cluster... OK
[2022-10-25 18:48:18+0000] Loading images... OK
[2022-10-25 18:48:18+0000] Waiting for reset jobs to finish...
[2022-10-25 18:48:28+0000] Operation reset in progress: 1       Completed: 0    Failed: 0
...
[2022-10-25 18:50:08+0000] Operation reset in progress: 0       Completed: 1    Failed: 0
[2022-10-25 18:50:08+0000] Flushing logs... OK
[2022-10-25 18:50:08+0000] Deleting GKE Hub member example-cluster-1 in project example-project-12345...
[2022-10-25 18:50:11+0000] Successfully deleted GKE Hub member example-cluster-1 in project example-project-12345
[2022-10-25 18:50:11+0000] Deleting bootstrap cluster... OK

kubectl

Vous pouvez utiliser kubectl pour supprimer des clusters d'utilisateur créés avec bmctl ou kubectl et qui ne sont pas enregistrés dans l'API GKE On-Prem. Pour supprimer un cluster d'utilisateur à l'aide de kubectl, vous devez d'abord supprimer l'objet de cluster, puis son espace de noms. Sinon, les tâches de réinitialisation des machines ne pourront pas être créées, et le processus de suppression risque d'être bloqué indéfiniment.

Pour supprimer un cluster d'utilisateur à l'aide de kubectl, procédez comme suit :

  1. Exécutez la commande suivante pour supprimer l'objet du cluster :

    kubectl delete cluster USER_CLUSTER_NAME -n USER_CLUSTER_NAMESPACE \
        --kubeconfig ADMIN_KUBECONFIG_PATH
    

    Dans la commande, remplacez les entrées suivantes par des informations spécifiques à votre environnement de cluster :

    • USER_CLUSTER_NAME : nom du cluster d'utilisateur que vous supprimez.

    • USER_CLUSTER_NAMESPACE : espace de noms du cluster. Par défaut, les espaces de noms de cluster pour Google Distributed Cloud sont le nom du cluster précédé de cluster-. Par exemple, si vous nommez votre cluster test, l'espace de noms porte un nom tel que cluster-test.

    • ADMIN_KUBECONFIG_PATH: chemin d'accès au fichier kubeconfig du cluster d'administrateur associé.

  2. Une fois le cluster supprimé, exécutez la commande suivante pour supprimer l'espace de noms :

    kubectl delete namespace USER_CLUSTER_NAMESPACE --kubeconfig ADMIN_KUBECONFIG_PATH
    

Console

Si le cluster d'utilisateur est géré par l'API GKE On-Prem, procédez comme suit pour le supprimer:

  1. Dans la console, accédez à la page de présentation des clusters Google Kubernetes Engine.

    Accéder aux clusters GKE

  2. Sélectionnez le projet Google Cloud dans lequel se trouve le cluster d'utilisateur.

  3. Dans la liste des clusters, cliquez sur le cluster que vous souhaitez modifier.

  4. Dans la liste des clusters, localisez celui que vous souhaitez supprimer. Si le type est external, cela signifie que le cluster a été créé à l'aide de bmctl et n'a pas été enregistré dans l'API GKE On-Prem. Dans ce cas, suivez les étapes de l'onglet bmctl ou kubectl pour supprimer le cluster.

    Si l'icône de la colonne État indique un problème, suivez les étapes décrites dans l'onglet de la gcloud CLI pour supprimer le cluster. Vous devez ajouter l'option --ignore-errors à la commande de suppression.

  5. Cliquez sur le nom du cluster que vous souhaitez supprimer.

  6. Dans le panneau Details (Détails), en haut de la fenêtre, cliquez sur Delete (Supprimer).

  7. Lorsque vous êtes invité à confirmer votre choix, saisissez le nom du cluster et cliquez sur Supprimer.

gcloud CLI

Si le cluster d'utilisateur est géré par l'API GKE On-Prem, procédez comme suit pour supprimer le cluster d'un ordinateur sur lequel la gcloud CLI est installée:

  1. Connectez-vous à votre compte Google :

    gcloud auth login
    
  2. Mettez à jour les composants :

    gcloud components update
    
  3. Obtenez la liste des clusters pour vous assurer de spécifier le nom de cluster correct dans la commande de suppression:

    gcloud container bare-metal clusters list \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION
    

    Remplacez les éléments suivants :

    • FLEET_HOST_PROJECT_ID: ID du projet dans lequel le cluster a été créé.

    • LOCATION: emplacement Google Cloud associé au cluster d'utilisateur.

    Le résultat ressemble à ce qui suit :

    NAME                      LOCATION    VERSION         ADMIN_CLUSTER            STATE
    example-user-cluster-1a   us-west1    1.29.100-gke.251          example-admin-cluster-1  RUNNING
    
  4. Exécutez la commande suivante pour supprimer le cluster:

    gcloud container bare-metal clusters delete USER_CLUSTER_NAME \
      --project=FLEET_HOST_PROJECT_ID \
      --location=LOCATION \
      --force \
      --allow-missing
    

    Remplacez les éléments suivants :

    • USER_CLUSTER_NAME: nom du cluster d'utilisateur à supprimer.

    • FLEET_HOST_PROJECT_ID: ID du projet dans lequel le cluster a été créé.

    • LOCATION: emplacement Google Cloud associé au cluster d'utilisateur.

    L'option --force vous permet de supprimer un cluster comportant des pools de nœuds. Sans l'option --force, vous devez d'abord supprimer les pools de nœuds, puis supprimer le cluster.

    L'option --allow-missing est une option standard de l'API Google. Lorsque vous incluez cette option, la commande renvoie un message de réussite si le cluster est introuvable.

    Si la commande renvoie une erreur contenant le texte failed connecting to the cluster's control plane, cela indique des problèmes de connectivité avec le cluster d'administrateur, l'agent Connect ou l'environnement sur site. Pour résoudre les problèmes liés à Connect Agent, consultez la section Collecter des journaux Connect Agent.

    • Si vous pensez que le problème de connectivité est temporaire (en raison de problèmes réseau, par exemple), attendez et relancez la commande.

    • Si vous savez que le cluster d'administrateur a été supprimé, et si les machines de nœud du cluster d'administrateur ou d'utilisateur ont été arrêtées ou mises hors connexion, incluez l'option --ignore-errors et relancez la commande.

      Vous devez également inclure --ignore-errors si le cluster a été supprimé à l'aide de bmctl ou kubectl, ce qui laisse les ressources de l'API GKE On-Prem dans Google Cloud. L'un des symptômes est que le cluster s'affiche toujours sur la page Clusters GKE de la console avec un état non opérationnel.

Pour en savoir plus sur les autres indicateurs, consultez la documentation de référence de la CLI gcloud.

Réinitialiser des nœuds de cluster spécifiques

Vous pouvez réinitialiser des nœuds spécifiques d'un cluster si, par exemple, un cluster d'administrateur a été supprimé, mais que les clusters d'utilisateur gérés par ce cluster d'administrateur demeurent. Dans ce cas, les clusters d'utilisateur dans leur ensemble ne peuvent pas être supprimés, car le cluster d'administrateur a été supprimé. Par conséquent, les nœuds des clusters d'utilisateur doivent être réinitialisés individuellement.

Pour réinitialiser les nœuds, vous devez disposer d'un compte de service disposant d'un accès en lecture à Google Container Registry (GCR). La commande bmctl attend le fichier de clé JSON de ce compte de service en tant qu'argument. Pour réinitialiser des nœuds individuels d'un cluster, exécutez la commande suivante :

bmctl reset nodes --addresses NODE_1_IP_ADDRESS,NODE_2_IP_ADDRESS \
    --ssh-private-key-path SSH_KEY_PATH \
    --gcr-service-account-key SERVICE_ACCOUNT_KEY_PATH \
    --login-user root

Dans la commande, remplacez les entrées suivantes par des informations spécifiques à votre environnement de cluster :

  • NODE_1_IP_ADDRESS , NODE_2_IP_ADDRESS : liste des adresses IP des nœuds à supprimer, séparées par une virgule.

  • SSH_KEY_PATH : chemin d'accès à la clé privée SSH. Il s'agit de la clé qui sera utilisée pour établir des connexions SSH avec les nœuds lors de la réinitialisation.

  • SERVICE_ACCOUNT_KEY_PATH : chemin d'accès au fichier JSON contenant la clé du compte de service. Cette clé accorde à bmctl l'autorisation d'extraire des images de Google Container Registry. Vous pouvez créer une clé de compte de service à l'aide de la console ou de gcloud CLI. Pour plus d'informations, consultez la page Créer et gérer les clés de comptes de service. Vous pouvez également créer le fichier de clé de compte de service si vous exécutez la commande create config avec l'option --create-service-accounts. Pour en savoir plus sur cette commande, consultez la section Créer et configurer une configuration de cluster d'administrateur avec bmctl.

Détails de la suppression du cluster

Lors de la suppression, l'enregistrement de l'appartenance au parc du cluster, les installations de stockage et les données du anthos-system StorageClass sont supprimés.

Pour tous les nœuds, les interfaces de tunnel utilisées pour la mise en réseau des clusters sont supprimées, ainsi que les répertoires suivants :

  • /etc/kubernetes
  • /etc/cni/net.d
  • /root/.kube
  • /var/lib/kubelet

Pour les nœuds d'équilibrage de charge :

  • Les services keepalived et haproxy sont supprimés.
  • Les fichiers de configuration pour keepalived et haproxy sont supprimés.