Vérification de l'état pour GKE sur Azure
La fonctionnalité de vérification de l'état de l'état surveille régulièrement l'état du plan de contrôle du cluster et de plusieurs composants critiques, et vous aide à détecter les problèmes potentiels liés à vos clusters.
Si vous avez besoin d'aide supplémentaire, contactez l'assistance Cloud Customer Care.Problèmes détectés
Le vérificateur de l'état du cluster détecte les problèmes suivants dans un cluster et vous en informe:
État de
kube-scheduler
sur les nœuds du plan de contrôle: sikube-scheduler
n'est pas opérationnel, cela signifie que le cluster rencontre des difficultés pour attribuer des pods aux nœuds. Pour aller plus loin, vous pouvez examiner le journal du podkube-scheduler
.État de
kube-controller-manager
sur les nœuds du plan de contrôle:kube-controller-manager
surveille divers contrôleurs, tels que les contrôleurs ReplicaSet, Déploiement et Espace de noms, entre autres. Si lekube-controller-manager
est considéré comme non opérationnel, cela suggère qu'un ou plusieurs des contrôleurs qu'il gère peuvent ne pas fonctionner correctement. Pour identifier précisément le problème rencontré, vous pouvez consulter le journal du podkube-controller-manager
, qui peut fournir plus d'informations sur le ou les contrôleurs défectueux.Capacité du volume racine: le vérificateur d'état vérifie que le volume racine de chaque nœud du plan de contrôle est suffisant. Si la capacité disponible est inférieure à 512 Mo, le vérificateur de l'état vous avertit du risque de manquer d'espace disque.
Afficher les événements de vérification de l'état
Pour afficher les alertes du vérificateur d'état pour un cluster spécifique, exécutez la commande suivante:
gcloud container azure clusters describe CLUSTER_NAME \
--location GOOGLE_CLOUD_LOCATION
Remplacez les éléments suivants :
CLUSTER_NAME
: nom de votre cluster.GOOGLE_CLOUD_LOCATION
: nom de l'emplacement Google Cloud qui gère le cluster
Voici un extrait du type de résultat attendu:
{ "name": "some-cluster-name", "description": "test-cluster", ... "errors": [ { "message": "Replica (replica-name)": kube-controller-manager is unhealthy" }, { "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left" } ] ... }
Dans cet exemple, le message d'erreur indique qu'un composant kube-controller-manager
n'est pas opérationnel et que la capacité sur le volume racine d'un nœud de plan de contrôle est faible.