Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
O recurso de verificação de integridade monitora regularmente a integridade do plano de controle do cluster e de vários componentes críticos e ajuda a detectar e diagnosticar possíveis problemas com seus clusters.
O verificador de integridade do cluster detecta e alerta você sobre os seguintes problemas em um cluster:
Integridade kube-scheduler nos nós do plano de controle : se o kube-scheduler não estiver íntegro, isso sugere que o cluster está com problemas para atribuir pods aos nós. Para investigar mais a fundo, você pode examinar o log de pods kube-scheduler .
Integridade kube-controller-manager nos nós do plano de controle : O kube-controller-manager monitora vários controladores, como os controladores ReplicaSet, Deployment e Namespace, entre outros. Se o kube-controller-manager for considerado iníquo, isso sugere que um ou mais controladores que ele gerencia podem não estar funcionando corretamente. Para determinar o problema exato, você pode examinar o log do pod kube-controller-manager , que pode fornecer mais informações sobre o(s) controlador(es) com defeito.
Capacidade do volume raiz : O verificador de integridade verifica se há capacidade suficiente no volume raiz de cada nó do plano de controle. Se a capacidade disponível for inferior a 512 MB, o verificador de integridade alerta sobre o risco potencial de falta de espaço em disco.
Ver eventos de verificação de saúde
Para visualizar alertas do verificador de integridade de um cluster específico, execute o seguinte comando:
GOOGLE_CLOUD_LOCATION : o nome do Google Cloudlocal que gerencia o cluster
Aqui está um trecho do tipo de saída que você pode esperar:
{
"name": "some-cluster-name",
"description": "test-cluster",
...
"errors": [
{
"message": "Replica (replica-name)": kube-controller-manager is unhealthy"
},
{
"message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
}
]
...
}
Neste exemplo, a mensagem de erro indica que um componente kube-controller-manager não está íntegro e que a capacidade no volume raiz de um nó do plano de controle está ficando baixa.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-06-12 UTC."],[],[],null,["# Diagnose cluster issues\n\nThe health check feature regularly monitors the health of the cluster control\nplane and several critical components, and helps you detect and diagnose\npotential problems with your clusters.\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/aws/getting-support).\n\nIssues detected\n---------------\n\nThe cluster health checker detects and alerts you to the\nfollowing issues in a cluster:\n\n- **`kube-scheduler` health on control plane nodes** : If the `kube-scheduler`\n is unhealthy, this suggests that the cluster is having trouble assigning Pods\n to nodes. To investigate further, you can examine the `kube-scheduler` Pod\n log.\n\n- **`kube-controller-manager` health on control plane nodes** : The\n `kube-controller-manager` monitors\n various controllers, such as the ReplicaSet, Deployment, and Namespace\n controllers, among others. If the `kube-controller-manager` is deemed\n unhealthy, this suggests that one or more of the controllers it manages might\n not be working properly. To determine the precise issue, you can examine the\n `kube-controller-manager` Pod log, which might provide more information about\n the malfunctioning controller(s).\n\n- **Root volume capacity**: The health checker checks for sufficient capacity\n on the root volume of each control plane node. If the available capacity\n falls under 512MB, the health checker alerts you to the potential risk of\n running out of disk space.\n\nView health check events\n------------------------\n\nTo view alerts from the health checker for a specific cluster, run the following\ncommand: \n\n gcloud container aws clusters describe \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e \\\n --location \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e: your cluster's name\n- \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e: the name of the Google Cloud location that manages the cluster\n\nHere's an excerpt of the kind of output you can expect:\n\n```\n{\n \"name\": \"some-cluster-name\",\n \"description\": \"test-cluster\",\n ...\n \"errors\": [\n {\n \"message\": \"Replica (replica-name)\": kube-controller-manager is unhealthy\"\n },\n {\n \"message\": \"Replica (replica-name)\": not enough disk space on root volume, only 9 MB left\"\n }\n ]\n ...\n}\n```\n\nIn this example, the error message indicates that a `kube-controller-manager`\ncomponent is unhealthy, and that the capacity on a control plane node's root\nvolume is getting low.\n\nWhat's next\n-----------\n\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/aws/getting-support)."]]