En esta página se describe cómo puedes analizar el estado de tus aplicaciones y mantener su disponibilidad y fiabilidad.
Funciones de observabilidad predeterminadas
De forma predeterminada, los clústeres de GKE están configurados para hacer lo siguiente:
- Envía registros del sistema, registros de auditoría y registros de aplicaciones a Cloud Logging.
- Envía métricas del sistema a Cloud Monitoring.
- Usa Google Cloud Managed Service para Prometheus para recoger métricas de terceros y definidas por el usuario configuradas y, a continuación, enviarlas a Cloud Monitoring. Google Cloud Managed Service for Prometheus te permite monitorizar tus cargas de trabajo y recibir alertas sobre ellas con Prometheus, sin tener que gestionar ni usar Prometheus manualmente a gran escala.
Personalizar y mejorar la recogida de datos
De forma predeterminada, GKE crea un repositorio de Logging para almacenar los registros de cada clúster. Puedes controlar qué registros y métricas se envían desde tu clúster de GKE a Cloud Logging y Cloud Monitoring.
También puedes controlar si quieres habilitar Google Cloud Managed Service para Prometheus.
En los clústeres de GKE Autopilot, no puedes inhabilitar la integración de Cloud Monitoring y Cloud Logging.
Métricas de observabilidad adicionales
Puede recoger métricas de observabilidad adicionales habilitando uno o varios paquetes de métricas de observabilidad.
- Métricas del plano de control: monitoriza el estado de los componentes de Kubernetes recogiendo métricas del servidor de la API de Kubernetes, del programador y del gestor de controladores. Estas métricas son señales útiles del estado del servicio para definir objetivos de nivel de servicio.
- Métricas de estado de Kube: monitoriza el estado de los objetos de Kubernetes, como los despliegues, los nodos y los pods.
- Métricas de cAdvisor o Kubelet: monitoriza el estado de los contenedores y de Kubelet.
Métricas de terceros y definidas por el usuario
Para monitorizar aplicaciones de terceros que se ejecutan en tus clústeres, como Postgres, MongoDB y Redis, usa exportadores de Prometheus con Google Cloud Managed Service para Prometheus.
También puedes escribir exportadores personalizados para monitorizar otras señales de estado y rendimiento.
Usar los datos recogidos
Usa los datos que recojas para analizar el estado de las aplicaciones, depurar, solucionar problemas y hacer pruebas mientras desarrollas, implementas y mantienes tus aplicaciones.
GKE ofrece funciones de observabilidad integradas para que puedas empezar rápidamente:
Consulta los datos recogidos de tus clústeres y cargas de trabajo en los paneles de observabilidad de GKE. Puedes personalizar los paneles de control proporcionados para los siguientes fines:
- Consulta métricas clave del clúster, como la utilización de la CPU y la memoria, y el número de incidencias abiertas.
- Consulta los clústeres por su infraestructura, cargas de trabajo o servicios.
- Inspecciona espacios de nombres, nodos, cargas de trabajo, servicios, pods y contenedores.
- En el caso de los pods y los contenedores, puede ver las métricas en función del tiempo y las entradas de registro.
También puedes crear tus propios paneles de control o importar paneles de control de Grafana para adaptarlos a tus necesidades.
En la pestaña Observabilidad, puede crear políticas de alertas recomendadas para recibir notificaciones sobre los problemas. Para obtener más información sobre las alertas, consulta la descripción general de las alertas.
Crea SLOs para monitorizar los objetivos de rendimiento de tu servicio con las métricas de GKE recogidas.
Usa los playbooks de GKE para solucionar problemas habituales, como Pods que no se pueden programar y contenedores que fallan repetidamente después de reiniciarse.
Explora y analiza tus datos con herramientas como Explorador de registros, Explorador de métricas y Informes de errores.
Consulta los registros de auditoría de GKE, que registran las actividades y los accesos administrativos como parte de los registros de auditoría de Cloud. La política de registros de auditoría determina qué eventos se registran y si una entrada de registro pertenece a un registro de actividad de administración o a un registro de acceso a los datos.
Otras funciones
GKE se integra con otros servicios Google Cloud para ayudarte a monitorizar y gestionar tus clústeres y cargas de trabajo.
Usa el panel de control de la estrategia de seguridad para identificar problemas de seguridad según nuestros estándares y las prácticas recomendadas del sector.
Consulta estadísticas y recomendaciones para optimizar tus clústeres.
Usa el registro de políticas de red para solucionar problemas con las políticas de red de Kubernetes. Si usas GKE Dataplane V2, el registro de políticas de red está integrado.
Precios
Los precios de la integración con Cloud Logging (incluidos los registros de auditoría de Cloud), Cloud Monitoring y Google Cloud Managed Service para Prometheus se basan en la cantidad de registros y métricas recogidos. Consulta la página Precios para obtener más información.
Las funciones proporcionadas por otros Google Cloud servicios que se indican en la sección Otras funciones tienen precios independientes. Consulta la sección Precios de esas páginas de documentación para obtener más información.
Siguientes pasos
Observa tus clústeres. Consulta cómo ver paneles de control, organizar información de clústeres y ver detalles de alertas.
Habilitar el registro de auditoría detallado a nivel de SO en los nodos del clúster de GKE y cómo exportar registros a Cloud Logging.
Para obtener más información sobre cómo usar las funciones de observabilidad para solucionar problemas de GKE, consulta Realizar análisis históricos con Cloud Logging y Realizar una monitorización proactiva con Cloud Monitoring.