Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
Diagnosticar problemas de clúster
La función de verificación de estado supervisa periódicamente el estado del plano de control del clúster y de varios componentes críticos, y le ayuda a detectar y diagnosticar posibles problemas con sus clústeres.
El verificador de estado del clúster detecta y le avisa sobre los siguientes problemas en un clúster:
Estado kube-scheduler en los nodos del plano de control : Si kube-scheduler no funciona correctamente, esto indica que el clúster tiene problemas para asignar pods a los nodos. Para investigar más a fondo, puede examinar el registro de pods kube-scheduler .
Estado kube-controller-manager en los nodos del plano de control : kube-controller-manager supervisa varios controladores, como los controladores ReplicaSet, Deployment y Namespace, entre otros. Si se considera que kube-controller-manager no funciona correctamente, es posible que uno o más de los controladores que administra no funcionen correctamente. Para determinar el problema, puede examinar el registro del pod kube-controller-manager , que podría proporcionar más información sobre los controladores que funcionan mal.
Capacidad del volumen raíz : El verificador de estado verifica la capacidad suficiente en el volumen raíz de cada nodo del plano de control. Si la capacidad disponible es inferior a 512 MB, el verificador le avisa del riesgo de quedarse sin espacio en disco.
Ver eventos de control de salud
Para ver las alertas del verificador de estado de un clúster específico, ejecute el siguiente comando:
GOOGLE_CLOUD_LOCATION : el nombre de la Google Cloudubicación que administra el clúster
A continuación se muestra un extracto del tipo de resultado que puede esperar:
{
"name": "some-cluster-name",
"description": "test-cluster",
...
"errors": [
{
"message": "Replica (replica-name)": kube-controller-manager is unhealthy"
},
{
"message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
}
]
...
}
En este ejemplo, el mensaje de error indica que un componente kube-controller-manager no está en buen estado y que la capacidad en el volumen raíz de un nodo del plano de control se está agotando.
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-06-12 (UTC)."],[],[],null,["# Diagnose cluster issues\n=======================\n\nThe health check feature regularly monitors the health of the cluster control\nplane and several critical components, and helps you detect and diagnose\npotential problems with your clusters.\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support).\n\nIssues detected\n---------------\n\nThe cluster health checker detects and alerts you to the\nfollowing issues in a cluster:\n\n- **`kube-scheduler` health on control plane nodes** : If the `kube-scheduler`\n is unhealthy, this suggests that the cluster is having trouble assigning Pods\n to nodes. To investigate further, you can examine the `kube-scheduler` Pod\n log.\n\n- **`kube-controller-manager` health on control plane nodes** : The\n `kube-controller-manager` monitors\n various controllers, such as the ReplicaSet, Deployment, and Namespace\n controllers, among others. If the `kube-controller-manager` is deemed\n unhealthy, this suggests that one or more of the controllers it manages might\n not be working properly. To determine the precise issue, you can examine the\n `kube-controller-manager` Pod log, which might provide more information about\n the malfunctioning controller(s).\n\n- **Root volume capacity**: The health checker checks for sufficient capacity\n on the root volume of each control plane node. If the available capacity\n falls under 512MB, the health checker alerts you to the potential risk of\n running out of disk space.\n\nView health check events\n------------------------\n\nTo view alerts from the health checker for a specific cluster, run the following\ncommand: \n\n gcloud container azure clusters describe \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e \\\n --location \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e: your cluster's name\n- \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e: the name of the Google Cloud location that manages the cluster\n\nHere's an excerpt of the kind of output you can expect:\n\n```\n{\n \"name\": \"some-cluster-name\",\n \"description\": \"test-cluster\",\n ...\n \"errors\": [\n {\n \"message\": \"Replica (replica-name)\": kube-controller-manager is unhealthy\"\n },\n {\n \"message\": \"Replica (replica-name)\": not enough disk space on root volume, only 9 MB left\"\n }\n ]\n ...\n}\n```\n\nIn this example, the error message indicates that a `kube-controller-manager`\ncomponent is unhealthy, and that the capacity on a control plane node's root\nvolume is getting low.\n\nWhat's next\n-----------\n\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support)."]]