Esta documentación es para la versión actual de GKE en AWS, publicada en noviembre de 2021. Consulta las notas de la versión para obtener más información.
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
La función de verificación de estado supervisa con regularidad el estado del plano de control del clúster y varios componentes críticos, y te ayuda a detectar posibles problemas en los clústeres.
El verificador de estado del clúster detecta y te alerta sobre los siguientes problemas en un clúster:
Estado kube-scheduler en los nodos del plano de control: Si kube-scheduler está en mal estado, esto sugiere que el clúster tiene problemas para asignar Pods a los nodos. Para investigar más, puedes examinar el registro del Pod kube-scheduler.
Estado kube-controller-manager en los nodos del plano de control: kube-controller-manager supervisa varios controladores, como ReplicaSet, Deployment y Namespace, entre otros. Si el kube-controller-manager se considera en mal estado, esto sugiere que uno o más de los controladores que administra podrían no funcionar de forma correcta. Para determinar el problema preciso, puedes examinar el registro del Pod kube-controller-manager, que podría proporcionar más información sobre los controladores que no funcionan.
Capacidad del volumen raíz: El verificador de estado comprueba la capacidad suficiente en el volumen raíz de cada nodo del plano de control. Si la capacidad disponible es inferior a 512 MB, el verificador de estado te alerta sobre el riesgo potencial de quedarte sin espacio en el disco.
Visualiza los eventos de verificación de estado
Para ver las alertas del verificador de estado de un clúster específico, ejecuta el siguiente comando:
GOOGLE_CLOUD_LOCATION es el nombre de la ubicación de Google Cloud que administra el clúster
Este es un extracto del tipo de resultado que puedes esperar:
{
"name": "some-cluster-name",
"description": "test-cluster",
...
"errors": [
{
"message": "Replica (replica-name)": kube-controller-manager is unhealthy"
},
{
"message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
}
]
...
}
En este ejemplo, el mensaje de error indica que un componente kube-controller-manager está en mal estado y que la capacidad en el volumen raíz de un plano de control es baja.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2024-07-02 (UTC)"],[],[],null,["# Diagnose cluster issues\n\nThe health check feature regularly monitors the health of the cluster control\nplane and several critical components, and helps you detect and diagnose\npotential problems with your clusters.\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/aws/getting-support).\n\nIssues detected\n---------------\n\nThe cluster health checker detects and alerts you to the\nfollowing issues in a cluster:\n\n- **`kube-scheduler` health on control plane nodes** : If the `kube-scheduler`\n is unhealthy, this suggests that the cluster is having trouble assigning Pods\n to nodes. To investigate further, you can examine the `kube-scheduler` Pod\n log.\n\n- **`kube-controller-manager` health on control plane nodes** : The\n `kube-controller-manager` monitors\n various controllers, such as the ReplicaSet, Deployment, and Namespace\n controllers, among others. If the `kube-controller-manager` is deemed\n unhealthy, this suggests that one or more of the controllers it manages might\n not be working properly. To determine the precise issue, you can examine the\n `kube-controller-manager` Pod log, which might provide more information about\n the malfunctioning controller(s).\n\n- **Root volume capacity**: The health checker checks for sufficient capacity\n on the root volume of each control plane node. If the available capacity\n falls under 512MB, the health checker alerts you to the potential risk of\n running out of disk space.\n\nView health check events\n------------------------\n\nTo view alerts from the health checker for a specific cluster, run the following\ncommand: \n\n gcloud container aws clusters describe \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e \\\n --location \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e: your cluster's name\n- \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e: the name of the Google Cloud location that manages the cluster\n\nHere's an excerpt of the kind of output you can expect:\n\n```\n{\n \"name\": \"some-cluster-name\",\n \"description\": \"test-cluster\",\n ...\n \"errors\": [\n {\n \"message\": \"Replica (replica-name)\": kube-controller-manager is unhealthy\"\n },\n {\n \"message\": \"Replica (replica-name)\": not enough disk space on root volume, only 9 MB left\"\n }\n ]\n ...\n}\n```\n\nIn this example, the error message indicates that a `kube-controller-manager`\ncomponent is unhealthy, and that the capacity on a control plane node's root\nvolume is getting low.\n\nWhat's next\n-----------\n\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/aws/getting-support)."]]