Résoudre les problèmes de création ou de mise à jour du cluster

Cette page vous explique comment résoudre les problèmes liés à l'installation ou à la mise à niveau de GKE sur Azure.

Si vous avez besoin d'aide supplémentaire, contactez l'assistance Cloud Customer Care.

Échecs de création de cluster

Lorsque vous effectuez une requête de création de cluster, les clusters GKE sur Azure commencent par exécuter un ensemble de tests préliminaires pour vérifier la requête. Si la création du cluster échoue, il se peut que l'un de ces tests préliminaires ait échoué ou qu'une étape du processus de création de cluster n'ait pas abouti.

En cas d'échec d'un test préliminaire, votre cluster ne crée aucune ressource et vous renvoie directement les informations sur l'erreur. Par exemple, si vous essayez de créer un cluster nommé invalid%%%name, le test préliminaire de validation du nom de cluster échoue et la requête renvoie l'erreur suivante :

ERROR: (gcloud.container.azure.clusters.create) INVALID_ARGUMENT: must be
between 1-63 characters, valid characters are /[a-z][0-9]-/, should start with a
letter, and end with a letter or a number: "invalid%%%name",
field: azure_cluster_id

La création du cluster peut également échouer une fois les tests préliminaires effectués. Cela peut se produire quelques minutes après le démarrage de la création du cluster, une fois que les clusters GKE sur Azure ont créé des ressources dans Google Cloud et Azure. Dans ce cas, une ressource Azure existe dans votre projet Google Cloud avec son état défini sur ERROR.

Pour obtenir des détails sur l'échec, exécutez la commande suivante :

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \
    --format "value(state, errors)"

Remplacez les éléments suivants :

  • CLUSTER_NAME par le nom du cluster dont vous interrogez l'état ;
  • GOOGLE_CLOUD_LOCATION par le nom de la région Google Cloud qui gère ce cluster Azure.

Vous pouvez également obtenir des informations sur l'échec de la création en décrivant la ressource Operation associée à l'appel d'API de création de cluster.

gcloud container azure operations describe OPERATION_ID

Remplacez OPERATION_ID par l'ID de l'opération qui a créé le cluster. Si vous ne disposez pas de l'ID d'opération de votre requête de création de cluster, vous pouvez le récupérer à l'aide de la commande suivante :

gcloud container azure operations list \
    --location GOOGLE_CLOUD_LOCATION

Utilisez l'horodatage ou les informations associées pour identifier l'opération de création de cluster qui vous intéresse.

Échec de la mise à jour du cluster

Lorsque vous mettez à jour un cluster, comme lorsque vous créez un cluster, GKE sur Azure exécute d'abord un ensemble de tests préliminaires pour vérifier la requête. Si la mise à jour du cluster échoue, il se peut que l'un de ces tests préliminaires ait échoué ou qu'une étape du processus de mise à jour de cluster n'ait pas abouti.

En cas d'échec d'un test préliminaire, votre cluster ne met à jour aucune ressource et vous renvoie directement les informations sur l'erreur. Par exemple, si vous essayez de mettre à jour un cluster pour utiliser une paire de clés SSH nommée test_ec2_keypair, le le test préliminaire tente de récupérer la paire de clés EC2 et échoue et la requête renvoie l'erreur suivante:

ERROR: (gcloud.container.azure.clusters.update) INVALID_ARGUMENT: key pair
"test_ec2_keypair" not found,
field: azure_cluster.control_plane.ssh_config.ec2_key_pair

La mise à jour du cluster peut également échouer une fois les tests préliminaires effectués. Cela peut se produire quelques minutes après le début de la mise à jour du cluster et alors que votre ressource Azure dans votre projet Google Cloud est définie sur l'état DEGRADED.

Pour obtenir des informations sur l'échec et l'opération associée, suivez les étapes décrites dans la section Échecs de création de cluster.

Étapes suivantes