Diagnosticar problemas de clúster

La función de verificación de estado supervisa periódicamente el estado del plano de control del clúster y de varios componentes críticos, y le ayuda a detectar y diagnosticar posibles problemas con sus clústeres.

Si necesita ayuda adicional, comuníquese con Atención al cliente de Cloud .

Problemas detectados

El verificador de estado del clúster detecta y le avisa sobre los siguientes problemas en un clúster:

  • Estado kube-scheduler en los nodos del plano de control : Si kube-scheduler no funciona correctamente, esto indica que el clúster tiene problemas para asignar pods a los nodos. Para investigar más a fondo, puede examinar el registro de pods kube-scheduler .

  • Estado kube-controller-manager en los nodos del plano de control : kube-controller-manager supervisa varios controladores, como los controladores ReplicaSet, Deployment y Namespace, entre otros. Si se considera que kube-controller-manager no funciona correctamente, es posible que uno o más de los controladores que administra no funcionen correctamente. Para determinar el problema, puede examinar el registro del pod kube-controller-manager , que podría proporcionar más información sobre los controladores que funcionan mal.

  • Capacidad del volumen raíz : El verificador de estado verifica la capacidad suficiente en el volumen raíz de cada nodo del plano de control. Si la capacidad disponible es inferior a 512 MB, el verificador le avisa del riesgo de quedarse sin espacio en disco.

Ver eventos de control de salud

Para ver las alertas del verificador de estado de un clúster específico, ejecute el siguiente comando:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Reemplace lo siguiente:

  • CLUSTER_NAME : el nombre de su clúster
  • GOOGLE_CLOUD_LOCATION : el nombre de la Google Cloudubicación que administra el clúster

A continuación se muestra un extracto del tipo de resultado que puede esperar:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

En este ejemplo, el mensaje de error indica que un componente kube-controller-manager no está en buen estado y que la capacidad en el volumen raíz de un nodo del plano de control se está agotando.

¿Qué sigue?

Si necesita ayuda adicional, comuníquese con Atención al cliente de Cloud .