Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Clusterprobleme diagnostizieren
Die Funktion „Systemstatus prüfen“ überwacht regelmäßig den Zustand der Clustersteuerungsebene und mehrerer kritischer Komponenten. So können Sie potenzielle Probleme mit Ihren Clustern erkennen und diagnostizieren.
Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.
Probleme festgestellt
Die Cluster-Systemdiagnose erkennt die folgenden Probleme in einem Cluster und benachrichtigt Sie darüber:
kube-scheduler-Zustand auf Steuerungsebenenknoten: Wenn der kube-scheduler-Zustand „nicht gesund“ ist, gibt es im Cluster Probleme beim Zuweisen von Pods zu Knoten. Weitere Informationen finden Sie im kube-scheduler-Pod-Log.
kube-controller-manager-Status auf Knoten der Steuerungsebene: kube-controller-manager überwacht verschiedene Controller, z. B. ReplicaSet-, Bereitstellungs- und Namespace-Controller. Wenn der kube-controller-manager als nicht gesund eingestuft wird, funktioniert mindestens einer der von ihm verwalteten Controller möglicherweise nicht richtig. Um das genaue Problem zu ermitteln, können Sie das kube-controller-manager-Pod-Protokoll prüfen. Es enthält möglicherweise weitere Informationen zu den nicht funktionierenden Controllern.
Kapazität des Stammvolumes: Die Systemdiagnose prüft, ob das Stammvolume jedes Knotens der Steuerungsebene ausreichend Kapazität hat. Wenn die verfügbare Kapazität unter 512 MB fällt, werden Sie von der Systemdiagnose auf das potenzielle Risiko hingewiesen, dass der Speicherplatz bald aufgebraucht ist.
Systemdiagnoseereignisse ansehen
Führen Sie den folgenden Befehl aus, um Benachrichtigungen von der Systemdiagnose für einen bestimmten Cluster aufzurufen:
GOOGLE_CLOUD_LOCATION: der Name des Google Cloud
Standorts, der den Cluster verwaltet.
Hier ein Auszug aus der zu erwartenden Ausgabe:
{
"name": "some-cluster-name",
"description": "test-cluster",
...
"errors": [
{
"message": "Replica (replica-name)": kube-controller-manager is unhealthy"
},
{
"message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
}
]
...
}
In diesem Beispiel gibt die Fehlermeldung an, dass eine kube-controller-manager-Komponente nicht betriebsbereit ist und dass die Kapazität des Stammvolumes eines Knotens der Steuerungsebene niedrig wird.
Nächste Schritte
Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-07-14 (UTC)."],[],[],null,["# Diagnose cluster issues\n=======================\n\nThe health check feature regularly monitors the health of the cluster control\nplane and several critical components, and helps you detect and diagnose\npotential problems with your clusters.\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support).\n\nIssues detected\n---------------\n\nThe cluster health checker detects and alerts you to the\nfollowing issues in a cluster:\n\n- **`kube-scheduler` health on control plane nodes** : If the `kube-scheduler`\n is unhealthy, this suggests that the cluster is having trouble assigning Pods\n to nodes. To investigate further, you can examine the `kube-scheduler` Pod\n log.\n\n- **`kube-controller-manager` health on control plane nodes** : The\n `kube-controller-manager` monitors\n various controllers, such as the ReplicaSet, Deployment, and Namespace\n controllers, among others. If the `kube-controller-manager` is deemed\n unhealthy, this suggests that one or more of the controllers it manages might\n not be working properly. To determine the precise issue, you can examine the\n `kube-controller-manager` Pod log, which might provide more information about\n the malfunctioning controller(s).\n\n- **Root volume capacity**: The health checker checks for sufficient capacity\n on the root volume of each control plane node. If the available capacity\n falls under 512MB, the health checker alerts you to the potential risk of\n running out of disk space.\n\nView health check events\n------------------------\n\nTo view alerts from the health checker for a specific cluster, run the following\ncommand: \n\n gcloud container azure clusters describe \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e \\\n --location \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e: your cluster's name\n- \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e: the name of the Google Cloud location that manages the cluster\n\nHere's an excerpt of the kind of output you can expect:\n\n```\n{\n \"name\": \"some-cluster-name\",\n \"description\": \"test-cluster\",\n ...\n \"errors\": [\n {\n \"message\": \"Replica (replica-name)\": kube-controller-manager is unhealthy\"\n },\n {\n \"message\": \"Replica (replica-name)\": not enough disk space on root volume, only 9 MB left\"\n }\n ]\n ...\n}\n```\n\nIn this example, the error message indicates that a `kube-controller-manager`\ncomponent is unhealthy, and that the capacity on a control plane node's root\nvolume is getting low.\n\nWhat's next\n-----------\n\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/azure/getting-support)."]]