Observabilidad para GKE


En esta página, se describe cómo puedes comprender el estado de tus aplicaciones y mantener la disponibilidad y confiabilidad de estas.

Cuando creas un clúster de GKE, Cloud Logging, Cloud Monitoring y Google Cloud Managed Service para Prometheus están habilitados de forma predeterminada y proporcionan observabilidad diseñada específicamente para Kubernetes.

  • Usa los paneles integrados para ver las métricas y los registros predeterminados y configurar alertas recomendadas.
  • Habilita los paquetes de observabilidad adicionales para supervisar los componentes y objetos de Kubernetes y usar los datos recopilados para depurar y solucionar problemas.
  • Configura la recopilación de datos para aplicaciones de terceros que se ejecutan en tus clústeres
  • Define tus propias métricas, paneles y alertas para satisfacer tus necesidades.

Además de la integración en Cloud Logging y Cloud Monitoring, GKE también proporciona otras funciones para ayudarte a observar y mantener el estado de tus aplicaciones.

Funciones de observabilidad predeterminadas

De forma predeterminada, los clústeres de GKE están configurados para hacer lo siguiente:

Personaliza y mejora la recopilación de datos

Puedes controlar qué registros y qué métricas, si las hay, se envían desde tu clúster de GKE a Cloud Logging y Cloud Monitoring.

También puedes controlar si habilitas Google Cloud Managed Service para Prometheus. Consulta Configura el registro y la supervisión para GKE para obtener instrucciones de configuración.

Para los clústeres de Autopilot de GKE, no puedes inhabilitar la integración de Cloud Monitoring y Cloud Logging.

Métricas de observabilidad adicionales

Puedes recopilar métricas de observabilidad adicionales si habilitas uno o más paquetes de métricas de observabilidad:

  • Métricas del plano de control: Supervisa el estado de los componentes de Kubernetes mediante la recopilación de métricas para el servidor de la API, Scheduler y el Administrador de controladores de Kubernetes. Estas métricas son indicadores útiles del estado del servicio para definir objetivos de nivel de servicio (SLO).
  • Kube State Metrics: supervisa el estado de los objetos de Kubernetes, como Deployments, nodos y Pods.

Si habilitaste GKE Enterprise en tu proyecto, estas métricas están habilitadas de forma predeterminada cuando te registras en una flota durante la creación del clúster.

Métricas definidas por el usuario y de terceros

Para supervisar las aplicaciones de terceros que se ejecutan en tus clústeres, como Postgres, MongoDB y Redis, usa exportadores de Prometheus con Google Cloud Managed Service para Prometheus.

También puedes escribir exportadores personalizados para supervisar otros indicadores de estado y rendimiento.

Usa los datos recopilados

Usa los datos que recopilas para analizar el estado de la aplicación, depurarla, solucionar problemas y realizar pruebas a medida que desarrollas, implementas y mantienes tus aplicaciones.

GKE proporciona funciones de observabilidad integradas para que puedas comenzar con rapidez:

  • Visualiza los datos recopilados para tus clústeres y cargas de trabajo en los paneles de observabilidad de GKE. Puedes personalizar los paneles proporcionados para los siguientes fines:

    • Visualizar las métricas clave del clúster, como el uso de CPU, el uso de memoria y la cantidad de incidentes abiertos.
    • Visualizar clústeres por su infraestructura, cargas de trabajo o Services.
    • Inspeccionar espacios de nombres, nodos, cargas de trabajo, Services, Pods y contenedores.
    • En el caso de los Pods y los contenedores, consultar las métricas como una función de tiempo y visualiza las entradas de registro.

    También puedes crear tus propios paneles o importar paneles de Grafana para satisfacer tus necesidades.

  • En la pestaña Observabilidad, puedes crear políticas de alertas recomendadas para recibir notificaciones sobre los problemas. Para obtener más información sobre las alertas, consulta la Descripción general de alertas.

  • Crea SLOs para supervisar los objetivos de rendimiento del servicio mediante métricas de GKE recopiladas.

  • Usa las guías de GKE para solucionar problemas comunes, como Pods no programables y contenedores que fallan repetidamente después del reinicio.

  • Explora y analiza tus datos con herramientas como el Explorador de registros, el Explorador de métricas y Error Reporting.

  • Revisa los registros de auditoría de GKE que registran actividades y accesos administrativos como parte de los registros de auditoría de Cloud. La política de registro de auditoría determina qué eventos se registran y si una entrada de registro pertenece a un registro de actividad del administrador o a un registro de acceso a datos.

Otras funciones

GKE se integra en otros servicios de Google Cloud para ayudarte a supervisar y administrar tus clústeres y cargas de trabajo.

Precios

Los precios de la integración en Cloud Logging (incluidos los registros de auditoría de Cloud), Cloud Monitoring y el servicio administrado de Google Cloud para Prometheus se basan en la cantidad de registros y métricas recopilados. Consulta la página de Precios para obtener más detalles.

Las funciones que proporcionan otros servicios de Google Cloud que se enumeran en Otras funciones tienen precios independientes. Consulta la sección Precios de esas páginas de documentación para obtener más información.

¿Qué sigue?