Verificación de estado de GKE en Azure

La función de verificación de estado supervisa periódicamente el estado del plano de control del clúster y varios componentes críticos, y te ayuda a detectar posibles problemas con los clústeres.

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.

Se detectaron problemas

El verificador de estado del clúster detecta los siguientes problemas y te alerta sobre ellos:

  • Estado de kube-scheduler en los nodos del plano de control: Si kube-scheduler está en mal estado, esto sugiere que el clúster tiene problemas para asignar Pods a los nodos. Para investigar más, puedes examinar el registro del Pod kube-scheduler.

  • Estado de kube-controller-manager en los nodos del plano de control: kube-controller-manager supervisa varios controladores, como los controladores de ReplicaSet, Deployment y Espacio de nombres, entre otros. Si kube-controller-manager se considera en mal estado, esto sugiere que uno o más de los controladores que administra podrían no funcionar correctamente. Para determinar el problema exacto, puedes examinar el registro del Pod kube-controller-manager, que podría proporcionar más información sobre los controladores que funcionan mal.

  • Capacidad del volumen raíz: El verificador de estado comprueba que haya capacidad suficiente en el volumen raíz de cada nodo del plano de control. Si la capacidad disponible es inferior a 512 MB, el verificador de estado te alerta sobre el riesgo potencial de quedarte sin espacio en el disco.

Visualiza eventos de verificación de estado

Para ver las alertas del verificador de estado de un clúster específico, ejecuta el siguiente comando:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Reemplaza lo siguiente:

  • CLUSTER_NAME: Es el nombre del clúster
  • GOOGLE_CLOUD_LOCATION es el nombre de la ubicación de Google Cloud que administra el clúster

Este es un extracto del tipo de resultado que puedes esperar:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

En este ejemplo, el mensaje de error indica que un componente kube-controller-manager no está en buen estado y que la capacidad del volumen raíz del nodo del plano de control está siendo baja.

¿Qué sigue?

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.