Cette documentation concerne la version la plus récente de GKE sur Azure, publiée en novembre 2021. Consultez les notes de version pour plus d'informations.
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Vérification de l'état pour GKE sur Azure
La fonctionnalité de vérification de l'état surveille régulièrement l'état du plan de contrôle du cluster et de plusieurs composants critiques, et vous aide à détecter les problèmes potentiels liés à vos clusters.
Le vérificateur d'état du cluster détecte les problèmes suivants dans un cluster et vous en avertit :
État de kube-scheduler sur les nœuds du plan de contrôle : si kube-scheduler n'est pas opérationnel, cela signifie que le cluster rencontre des difficultés pour attribuer des pods aux nœuds. Pour en savoir plus, vous pouvez examiner le journal de pod kube-scheduler.
État de kube-controller-manager sur les nœuds du plan de contrôle : kube-controller-manager surveille divers contrôleurs, tels que les contrôleurs ReplicaSet, Deployment et Namespace, entre autres. Si kube-controller-manager est jugé non fonctionnel, cela signifie qu'un ou plusieurs des contrôleurs qu'il gère peuvent ne pas fonctionner correctement. Pour déterminer précisément le problème rencontré, vous pouvez consulter le journal du pod kube-controller-manager, qui peut fournir plus d'informations sur
le ou les contrôleurs défectueux.
Capacité du volume racine : le vérificateur d'intégrité vérifie que la capacité du volume racine de chaque nœud du plan de contrôle est suffisante. Si la capacité disponible passe sous 512 Mo, l'outil de vérification de l'état vous avertit du risque potentiel de manquer d'espace disque.
Afficher les événements de vérification de l'état
Pour afficher les alertes du vérificateur d'état pour un cluster spécifique, exécutez la commande suivante :
GOOGLE_CLOUD_LOCATION : nom de l'emplacement Google Cloud qui gère le cluster
Voici un extrait du type de résultat que vous pouvez obtenir :
{
"name": "some-cluster-name",
"description": "test-cluster",
...
"errors": [
{
"message": "Replica (replica-name)": kube-controller-manager is unhealthy"
},
{
"message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
}
]
...
}
Dans cet exemple, le message d'erreur indique qu'un composant kube-controller-manager
n'est pas opérationnel, et que la capacité sur le volume racine du nœud d'un plan de contrôle est trop faible.
Étapes suivantes
Si vous avez besoin d'une aide supplémentaire, contactez Cloud Customer Care.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2024/07/01 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2024/07/01 (UTC)."],[],[],null,["# Diagnose cluster issues\n=======================\n\nThe health check feature regularly monitors the health of the cluster control\nplane and several critical components, and helps you detect and diagnose\npotential problems with your clusters.\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support).\n\nIssues detected\n---------------\n\nThe cluster health checker detects and alerts you to the\nfollowing issues in a cluster:\n\n- **`kube-scheduler` health on control plane nodes** : If the `kube-scheduler`\n is unhealthy, this suggests that the cluster is having trouble assigning Pods\n to nodes. To investigate further, you can examine the `kube-scheduler` Pod\n log.\n\n- **`kube-controller-manager` health on control plane nodes** : The\n `kube-controller-manager` monitors\n various controllers, such as the ReplicaSet, Deployment, and Namespace\n controllers, among others. If the `kube-controller-manager` is deemed\n unhealthy, this suggests that one or more of the controllers it manages might\n not be working properly. To determine the precise issue, you can examine the\n `kube-controller-manager` Pod log, which might provide more information about\n the malfunctioning controller(s).\n\n- **Root volume capacity**: The health checker checks for sufficient capacity\n on the root volume of each control plane node. If the available capacity\n falls under 512MB, the health checker alerts you to the potential risk of\n running out of disk space.\n\nView health check events\n------------------------\n\nTo view alerts from the health checker for a specific cluster, run the following\ncommand: \n\n gcloud container azure clusters describe \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e \\\n --location \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e: your cluster's name\n- \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e: the name of the Google Cloud location that manages the cluster\n\nHere's an excerpt of the kind of output you can expect:\n\n```\n{\n \"name\": \"some-cluster-name\",\n \"description\": \"test-cluster\",\n ...\n \"errors\": [\n {\n \"message\": \"Replica (replica-name)\": kube-controller-manager is unhealthy\"\n },\n {\n \"message\": \"Replica (replica-name)\": not enough disk space on root volume, only 9 MB left\"\n }\n ]\n ...\n}\n```\n\nIn this example, the error message indicates that a `kube-controller-manager`\ncomponent is unhealthy, and that the capacity on a control plane node's root\nvolume is getting low.\n\nWhat's next\n-----------\n\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support)."]]