Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
O recurso de verificação de integridade monitora regularmente a integridade do plano de controle do cluster e vários componentes críticos e ajuda a detectar possíveis problemas com os clusters.
O verificador de integridade do cluster detecta e alerta você sobre os seguintes problemas em um cluster:
Integridade de kube-scheduler em nós do plano de controle: se kube-scheduler não estiver íntegro, isso sugere que o cluster está com problemas para atribuir pods a nós. Para investigar mais, examine o registro de pod kube-scheduler.
Integridade do kube-controller-manager em nós do plano de controle: o
kube-controller-manager monitora
vários controladores, como os ReplicaSet, Deployment e controladores de namespace,
entre outros. Se o kube-controller-manager for considerado
não íntegro, isso sugere que um ou mais dos controladores que ele gerencia
pode não estar funcionando corretamente. Para determinar o problema preciso, é possível examinar o registro do pod kube-controller-manager, que pode fornecer mais informações sobre os controladores com falha.
Capacidade do volume raiz: o verificador de integridade verifica a capacidade suficiente no volume raiz de cada nó do plano de controle. Se a capacidade disponível estiver abaixo de 512 MB, o verificador de integridade alertará você sobre o risco de ficar sem espaço em disco.
Como visualizar eventos de verificação de integridade
Para ver alertas do verificador de integridade de um cluster específico, execute o seguinte comando:
GOOGLE_CLOUD_LOCATION: o nome do local do Google Cloud
que gerencia o cluster
Veja um trecho do tipo de saída esperada:
{
"name": "some-cluster-name",
"description": "test-cluster",
...
"errors": [
{
"message": "Replica (replica-name)": kube-controller-manager is unhealthy"
},
{
"message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
}
]
...
}
Neste exemplo, a mensagem de erro indica que um componente kube-controller-manager não está íntegro e que a capacidade no volume raiz de um nó do plano de controle está ficando baixa.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2024-06-26 UTC."],[],[],null,["# Diagnose cluster issues\n\nThe health check feature regularly monitors the health of the cluster control\nplane and several critical components, and helps you detect and diagnose\npotential problems with your clusters.\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/aws/getting-support).\n\nIssues detected\n---------------\n\nThe cluster health checker detects and alerts you to the\nfollowing issues in a cluster:\n\n- **`kube-scheduler` health on control plane nodes** : If the `kube-scheduler`\n is unhealthy, this suggests that the cluster is having trouble assigning Pods\n to nodes. To investigate further, you can examine the `kube-scheduler` Pod\n log.\n\n- **`kube-controller-manager` health on control plane nodes** : The\n `kube-controller-manager` monitors\n various controllers, such as the ReplicaSet, Deployment, and Namespace\n controllers, among others. If the `kube-controller-manager` is deemed\n unhealthy, this suggests that one or more of the controllers it manages might\n not be working properly. To determine the precise issue, you can examine the\n `kube-controller-manager` Pod log, which might provide more information about\n the malfunctioning controller(s).\n\n- **Root volume capacity**: The health checker checks for sufficient capacity\n on the root volume of each control plane node. If the available capacity\n falls under 512MB, the health checker alerts you to the potential risk of\n running out of disk space.\n\nView health check events\n------------------------\n\nTo view alerts from the health checker for a specific cluster, run the following\ncommand: \n\n gcloud container aws clusters describe \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e \\\n --location \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eCLUSTER_NAME\u003c/var\u003e: your cluster's name\n- \u003cvar translate=\"no\"\u003eGOOGLE_CLOUD_LOCATION\u003c/var\u003e: the name of the Google Cloud location that manages the cluster\n\nHere's an excerpt of the kind of output you can expect:\n\n```\n{\n \"name\": \"some-cluster-name\",\n \"description\": \"test-cluster\",\n ...\n \"errors\": [\n {\n \"message\": \"Replica (replica-name)\": kube-controller-manager is unhealthy\"\n },\n {\n \"message\": \"Replica (replica-name)\": not enough disk space on root volume, only 9 MB left\"\n }\n ]\n ...\n}\n```\n\nIn this example, the error message indicates that a `kube-controller-manager`\ncomponent is unhealthy, and that the capacity on a control plane node's root\nvolume is getting low.\n\nWhat's next\n-----------\n\nIf you need additional assistance, reach out to [Cloud Customer Care](/kubernetes-engine/multi-cloud/docs/aws/getting-support)."]]