Observabilidad de GKE


En esta página se describe cómo puedes analizar el estado de tus aplicaciones y mantener su disponibilidad y fiabilidad.

Funciones de observabilidad predeterminadas

De forma predeterminada, los clústeres de GKE están configurados para hacer lo siguiente:

Personalizar y mejorar la recogida de datos

De forma predeterminada, GKE crea un repositorio de Logging para almacenar los registros de cada clúster. Puedes controlar qué registros y métricas se envían desde tu clúster de GKE a Cloud Logging y Cloud Monitoring.

También puedes controlar si quieres habilitar Google Cloud Managed Service para Prometheus.

En los clústeres de GKE Autopilot, no puedes inhabilitar la integración de Cloud Monitoring y Cloud Logging.

Métricas de observabilidad adicionales

Puede recoger métricas de observabilidad adicionales habilitando uno o varios paquetes de métricas de observabilidad.

  • Métricas del plano de control: monitoriza el estado de los componentes de Kubernetes recogiendo métricas del servidor de la API de Kubernetes, del programador y del gestor de controladores. Estas métricas son señales útiles del estado del servicio para definir objetivos de nivel de servicio.
  • Métricas de estado de Kube: monitoriza el estado de los objetos de Kubernetes, como los despliegues, los nodos y los pods.
  • Métricas de cAdvisor o Kubelet: monitoriza el estado de los contenedores y de Kubelet.

Métricas de terceros y definidas por el usuario

Para monitorizar aplicaciones de terceros que se ejecutan en tus clústeres, como Postgres, MongoDB y Redis, usa exportadores de Prometheus con Google Cloud Managed Service para Prometheus.

También puedes escribir exportadores personalizados para monitorizar otras señales de estado y rendimiento.

Usar los datos recogidos

Usa los datos que recojas para analizar el estado de las aplicaciones, depurar, solucionar problemas y hacer pruebas mientras desarrollas, implementas y mantienes tus aplicaciones.

GKE ofrece funciones de observabilidad integradas para que puedas empezar rápidamente:

  • Consulta los datos recogidos de tus clústeres y cargas de trabajo en los paneles de observabilidad de GKE. Puedes personalizar los paneles de control proporcionados para los siguientes fines:

    • Consulta métricas clave del clúster, como la utilización de la CPU y la memoria, y el número de incidencias abiertas.
    • Consulta los clústeres por su infraestructura, cargas de trabajo o servicios.
    • Inspecciona espacios de nombres, nodos, cargas de trabajo, servicios, pods y contenedores.
    • En el caso de los pods y los contenedores, puede ver las métricas en función del tiempo y las entradas de registro.

    También puedes crear tus propios paneles de control o importar paneles de control de Grafana para adaptarlos a tus necesidades.

  • En la pestaña Observabilidad, puede crear políticas de alertas recomendadas para recibir notificaciones sobre los problemas. Para obtener más información sobre las alertas, consulta la descripción general de las alertas.

  • Crea SLOs para monitorizar los objetivos de rendimiento de tu servicio con las métricas de GKE recogidas.

  • Usa los playbooks de GKE para solucionar problemas habituales, como Pods que no se pueden programar y contenedores que fallan repetidamente después de reiniciarse.

  • Explora y analiza tus datos con herramientas como Explorador de registros, Explorador de métricas y Informes de errores.

  • Consulta los registros de auditoría de GKE, que registran las actividades y los accesos administrativos como parte de los registros de auditoría de Cloud. La política de registros de auditoría determina qué eventos se registran y si una entrada de registro pertenece a un registro de actividad de administración o a un registro de acceso a los datos.

Otras funciones

GKE se integra con otros servicios Google Cloud para ayudarte a monitorizar y gestionar tus clústeres y cargas de trabajo.

Precios

Los precios de la integración con Cloud Logging (incluidos los registros de auditoría de Cloud), Cloud Monitoring y Google Cloud Managed Service para Prometheus se basan en la cantidad de registros y métricas recogidos. Consulta la página Precios para obtener más información.

Las funciones proporcionadas por otros Google Cloud servicios que se indican en la sección Otras funciones tienen precios independientes. Consulta la sección Precios de esas páginas de documentación para obtener más información.

Siguientes pasos