Evaluar el estado de los clústeres y las cargas de trabajo en la consola de Google Cloud


Cuando necesitas comprobar rápidamente el estado de tus clústeres y cargas de trabajo de Google Kubernetes Engine (GKE), puede ser difícil saber por dónde empezar. Visualizar el estado de tus clústeres y cargas de trabajo en la consola Google Cloud te ayuda a evaluar rápidamente el estado de tu entorno. El estado del clúster hace referencia al estado de la infraestructura de GKE subyacente, como los nodos y la red, mientras que el estado de la carga de trabajo hace referencia al estado y al rendimiento de las aplicaciones que se ejecutan en el clúster.

En esta página se explica cómo desplazarse por las páginas de clústeres y cargas de trabajo de Kubernetes para obtener una descripción general, identificar posibles problemas (como nodos con escasez de recursos o pods con errores) y consultar información más detallada sobre recursos específicos.

Esta información es importante para los administradores y operadores de la plataforma que son responsables de mantener la estabilidad del clúster y necesitan realizar evaluaciones rápidas del estado y comprobaciones de los recursos. También es esencial para los desarrolladores de aplicaciones que necesiten conocer el estado del tiempo de ejecución de sus implementaciones e investigar los fallos. Para obtener más información sobre los roles habituales y las tareas de ejemplo a los que hacemos referencia en el contenido de Google Cloud , consulta Roles y tareas habituales de los usuarios de GKE.

Para ofrecerte una visión completa del estado de tu aplicación, la consola también te da acceso a potentes herramientas de registro y monitorización, lo que te permite investigar la causa principal de los fallos anteriores y evitar que se produzcan en el futuro. Google Cloud Para obtener más información sobre estas herramientas, consulta los artículos Realizar análisis históricos con Cloud Logging y Realizar una monitorización proactiva con Cloud Monitoring.

Buscar problemas de clústeres

La página Clústeres de Kubernetes te ofrece una vista general del estado de tus clústeres. Para identificar problemas en cualquiera de tus clústeres, empieza en esta página.

A continuación se muestran algunos ejemplos de cómo puedes usar esta página para solucionar problemas:

  • Para obtener consejos sobre cómo mejorar el estado de tu clúster, tu estrategia de actualización y la optimización de costes, haz clic en Ver recomendaciones.
  • Para identificar clústeres incorrectos, consulta la columna Estado. Los clústeres que no tengan una marca de verificación verde requieren atención.
  • Para ver los posibles problemas, consulta la columna Notificaciones. Haz clic en cualquier mensaje de notificación para obtener más información.

Investigar un clúster específico

Cuando detecte un problema con un clúster, consulte la página Detalles del clúster para obtener información detallada que le ayude a solucionar el problema y a comprender su configuración.

Para ir a la página Detalles de un clúster, sigue estos pasos:

  1. Ve a la página Clústeres de Kubernetes.

    Ir a clústeres de Kubernetes

  2. Revise la columna Nombre y haga clic en el nombre del clúster que quiera investigar.

A continuación, se muestran algunos ejemplos de cómo usar la página Detalles del clúster para solucionar problemas relacionados con él:

  • Para comprobar el estado general, prueba las siguientes opciones:

    • Para ver los paneles de control a nivel de clúster, vaya a la pestaña Observabilidad. De forma predeterminada, GKE habilita Cloud Monitoring cuando creas un clúster. Si Cloud Monitoring está habilitado, GKE configura automáticamente los paneles de control de esta página. Estas son algunas de las vistas que pueden resultarte más útiles para solucionar problemas:

      • Resumen: consulta un resumen general del estado, el uso de recursos y los eventos clave de tu clúster. Este panel te ayuda a evaluar rápidamente el estado general de tu clúster e identificar posibles problemas.
      • Métricas de tráfico: consulta métricas de redes basadas en nodos para obtener información valiosa sobre el tráfico entre tus cargas de trabajo de Kubernetes.
      • Estado de la carga de trabajo: consulta el estado de las implementaciones, los pods y los contenedores. Identifica las instancias que fallan o no están en buen estado y detecta las restricciones de recursos.
      • Plano de control: consulta el estado y el rendimiento del plano de control. Este panel de control te permite monitorizar métricas clave de componentes como kube-apiserver y etcd, identificar cuellos de botella en el rendimiento y detectar fallos en los componentes.

    • Para ver los errores recientes de la aplicación, ve a la pestaña Errores de la aplicación. La información de esta pestaña puede ayudarte a priorizar y resolver errores, ya que muestra el número de veces que se han producido, cuándo apareció un error por primera vez y cuándo se produjo por última vez.

      Para investigar un error en profundidad, haga clic en el mensaje de error para ver un informe detallado, incluidos los enlaces a los registros pertinentes.

  • Si tienes problemas después de una actualización o un cambio recientes, consulta la sección Aspectos básicos del clúster de la pestaña Detalles del clúster. Confirma que la versión que aparece en el campo Versión es la que esperas. Para obtener más información, haz clic en Mostrar historial de actualizaciones en la sección Actualizaciones.

  • Si usas un clúster estándar y tus pods están atascados en el estado Pending o sospechas que los nodos están sobrecargados, consulta la pestaña Nodos. La pestaña Nodos no está disponible en los clústeres de Autopilot porque GKE gestiona los nodos por ti.

    • En la sección Grupos de nodos, comprueba que el escalado automático esté configurado correctamente y que el tipo de máquina sea adecuado para tus cargas de trabajo.
    • En la sección Nodos, busca cualquier nodo que no tenga el estado Ready. El estado NotReady indica que hay un problema con el propio nodo, como una presión de recursos o un problema con kubelet (el agente que se ejecuta en cada nodo para gestionar los contenedores).

Buscar problemas de carga de trabajo

Si sospechas que hay un problema con una aplicación concreta, como un error en la implementación, ve a la página Cargas de trabajo de la consola de Google Cloud . En esta página se ofrece una vista centralizada de todas las aplicaciones que se ejecutan en tus clústeres.

A continuación se muestran algunos ejemplos de cómo puedes usar esta página para solucionar problemas:

  • Para identificar las cargas de trabajo que no están en buen estado, consulta la columna Estado. Cualquier carga de trabajo que no tenga una marca de verificación verde requiere atención.
  • Si una aplicación no responde, consulta la columna Pods. Por ejemplo, un estado como 1/3 significa que solo se está ejecutando una de las tres réplicas de la aplicación, lo que indica que hay un problema.

Investigar una carga de trabajo específica

Una vez que hayas identificado una carga de trabajo problemática en la vista general, consulta la página Detalles de la carga de trabajo para empezar a aislar la causa principal.

Para ir a la página Detalles de una carga de trabajo, haz lo siguiente:

  1. Ve a la página Cargas de trabajo.

    Ve a Cargas de trabajo.

  2. Consulta la columna Nombre y haz clic en el nombre de la carga de trabajo que quieras investigar.

A continuación, se muestran algunos ejemplos de cómo usar la página Detalles de la carga de trabajo para solucionar problemas relacionados con tus cargas de trabajo:

  • Para comprobar la configuración de la carga de trabajo, usa las pestañas Resumen y Detalles de la carga de trabajo. Puedes usar esta información para verificar eventos como si se ha implementado la etiqueta de imagen de contenedor correcta o para comprobar las solicitudes y los límites de recursos de la carga de trabajo.

  • Para encontrar el nombre de un pod específico que falla, ve a la sección Pods gestionados. Puede que necesites esta información para los comandos de kubectl. En esta sección se muestran todos los pods controlados por la carga de trabajo, junto con sus estados.

  • Para ver el historial de cambios recientes de una carga de trabajo, vaya a la pestaña Historial de revisiones. Si detectas problemas de rendimiento después de una nueva implementación, usa esta sección para identificar qué revisión está activa. Después, puede comparar las configuraciones de la revisión actual con las anteriores para identificar el origen del problema. Si esta pestaña no está visible, la carga de trabajo es de un tipo que no usa revisiones o aún no se ha actualizado.

  • Si parece que una implementación ha fallado, ve a la pestaña Eventos. Esta página suele ser la fuente de información más valiosa, ya que muestra eventos a nivel de Kubernetes.

  • Para consultar los registros de tu aplicación, haz clic en la pestaña Registros. Esta página te ayuda a entender qué ocurre en tu clúster. Aquí encontrarás mensajes de error y seguimientos de pila que pueden ayudarte a diagnosticar problemas.

  • Para confirmar exactamente lo que se ha implementado, consulta la pestaña YAML. En esta página se muestra el manifiesto YAML activo de la carga de trabajo tal como está en el clúster. Esta información es útil para detectar cualquier discrepancia en los manifiestos controlados por código fuente. Si estás viendo el manifiesto YAML de un solo pod, esta pestaña también te muestra el estado del pod, lo que te permite obtener información valiosa sobre los fallos a nivel de pod.

Siguientes pasos