Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Diagnostica dei problemi relativi ai cluster
La funzionalità di controllo di integrità monitora regolarmente l'integrità del piano di controllo del cluster e di diversi componenti critici e ti aiuta a rilevare e diagnosticare potenziali problemi con i cluster.
Il controllo dell'integrità del cluster rileva e ti avvisa dei
seguenti problemi in un cluster:
Integrità di kube-scheduler sui nodi del piano di controllo: se kube-scheduler
non è integro, significa che il cluster ha difficoltà ad assegnare pod
ai nodi. Per ulteriori indagini, puoi esaminare il log del pod kube-scheduler.
Stato di kube-controller-manager sui nodi del piano di controllo: kube-controller-manager monitora vari controller, come ReplicaSet, Deployment e Namespace, tra gli altri. Se kube-controller-manager è considerato
non integro, significa che uno o più dei controller che gestisce potrebbero
non funzionare correttamente. Per determinare il problema esatto, puoi esaminare il log del pod kube-controller-manager, che potrebbe fornire maggiori informazioni sui controller malfunzionanti.
Capacità del volume radice: il controllo di integrità verifica che la capacità
del volume radice di ogni nodo del control plane sia sufficiente. Se la capacità disponibile
è inferiore a 512 MB, il controllo di integrità ti avvisa del potenziale rischio di
esaurimento dello spazio su disco.
Visualizzare gli eventi di controllo di integrità
Per visualizzare gli avvisi del controllo dell'integrità per un cluster specifico, esegui il seguente
comando:
GOOGLE_CLOUD_LOCATION: il nome della Google Cloud
posizione che gestisce il cluster
Ecco un estratto del tipo di output che puoi aspettarti:
{
"name": "some-cluster-name",
"description": "test-cluster",
...
"errors": [
{
"message": "Replica (replica-name)": kube-controller-manager is unhealthy"
},
{
"message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
}
]
...
}
In questo esempio, il messaggio di errore indica che un componente kube-controller-manager
non è integro e che la capacità del volume root di un nodo del piano di controllo
sta diminuendo.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-07-14 UTC."],[],[],null,["# Diagnose cluster issues\n=======================\n\nThe health check feature regularly monitors the health of the cluster control\nplane and several critical components, and helps you detect and diagnose\npotential problems with your clusters.\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support).\n\nIssues detected\n---------------\n\nThe cluster health checker detects and alerts you to the\nfollowing issues in a cluster:\n\n- **`kube-scheduler` health on control plane nodes** : If the `kube-scheduler`\n is unhealthy, this suggests that the cluster is having trouble assigning Pods\n to nodes. To investigate further, you can examine the `kube-scheduler` Pod\n log.\n\n- **`kube-controller-manager` health on control plane nodes** : The\n `kube-controller-manager` monitors\n various controllers, such as the ReplicaSet, Deployment, and Namespace\n controllers, among others. If the `kube-controller-manager` is deemed\n unhealthy, this suggests that one or more of the controllers it manages might\n not be working properly. To determine the precise issue, you can examine the\n `kube-controller-manager` Pod log, which might provide more information about\n the malfunctioning controller(s).\n\n- **Root volume capacity**: The health checker checks for sufficient capacity\n on the root volume of each control plane node. If the available capacity\n falls under 512MB, the health checker alerts you to the potential risk of\n running out of disk space.\n\nView health check events\n------------------------\n\nTo view alerts from the health checker for a specific cluster, run the following\ncommand: \n\n gcloud container azure clusters describe \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e \\\n --location \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e: your cluster's name\n- \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e: the name of the Google Cloud location that manages the cluster\n\nHere's an excerpt of the kind of output you can expect:\n\n```\n{\n \"name\": \"some-cluster-name\",\n \"description\": \"test-cluster\",\n ...\n \"errors\": [\n {\n \"message\": \"Replica (replica-name)\": kube-controller-manager is unhealthy\"\n },\n {\n \"message\": \"Replica (replica-name)\": not enough disk space on root volume, only 9 MB left\"\n }\n ]\n ...\n}\n```\n\nIn this example, the error message indicates that a `kube-controller-manager`\ncomponent is unhealthy, and that the capacity on a control plane node's root\nvolume is getting low.\n\nWhat's next\n-----------\n\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support)."]]