Observabilité pour GKE

Cette page explique comment comprendre l'état de vos applications, et maintenir leur disponibilité et leur fiabilité.

Lorsque vous créez un cluster GKE, Cloud Logging, Cloud Monitoring et Google Cloud Managed Service pour Prometheus sont activés par défaut et offrent une observabilité spécifique à Kubernetes.

Utilisez les tableaux de bord intégrés pour afficher les métriques et les journaux par défaut, et configurer les alertes recommandées.
Activez des packages d'observabilité supplémentaires pour surveiller les composants et les objets Kubernetes et utiliser les données collectées pour le débogage et le dépannage.
Configurez la collecte de données pour les applications tierces exécutées sur vos clusters.
Définissez vos propres métriques, tableaux de bord et alertes en fonction de vos besoins.

En plus de l'intégration à Cloud Logging et Cloud Monitoring, GKE fournit également d'autres fonctionnalités pour vous aider à observer et à maintenir l'état de vos applications.

Fonctionnalités d'observabilité par défaut

Par défaut, les clusters GKE sont configurés pour effectuer les opérations suivantes :

Envoyer les journaux système, les journaux d'audit et les journaux d'application à Cloud Logging.
Envoyer des métriques système à Cloud Monitoring.
Utiliser Google Cloud Managed Service pour Prometheus pour collecter les métriques tierces et définies par l'utilisateur configurées, puis les envoyer à Cloud Monitoring. Google Cloud Managed Service pour Prometheus vous permet de surveiller vos charges de travail et d'envoyer des alertes à l'aide de Prometheus, sans avoir à gérer et exploiter manuellement Prometheus à grande échelle.

Personnaliser et améliorer la collecte de données

Vous pouvez contrôler les journaux et les métriques, le cas échéant, envoyées depuis votre cluster GKE vers Cloud Logging et Cloud Monitoring.

Vous pouvez également activer ou désactiver le service géré Google Cloud pour Prometheus. Pour obtenir des instructions de configuration, consultez la page Configurer la journalisation et la surveillance pour GKE.

Vous ne pouvez pas désactiver l'intégration de Cloud Monitoring et Cloud Logging pour les clusters GKE Autopilot.

Métriques d'observabilité supplémentaires

Vous pouvez collecter des métriques d'observabilité supplémentaires en activant un ou plusieurs packages de métriques d'observabilité :

Métriques du plan de contrôle : surveillez l'état des composants Kubernetes en collectant des métriques pour le serveur d'API Kubernetes, le programmeur et le gestionnaire de contrôleurs. Ces métriques sont des signaux utiles de l'état du service pour définir des objectifs de niveau de service (SLO).
Kube State Metrics : surveillez l'état des objets Kubernetes tels que les déploiements, les nœuds et les pods.

Si vous avez activé GKE Enterprise dans votre projet, ces métriques sont activées par défaut lorsque vous effectuez l'enregistrement dans un parc lors de la création du cluster.

Métriques tierces et définies par l'utilisateur

Pour surveiller les applications tierces s'exécutant sur vos clusters, telles que Postgres, MongoDB et Redis, utilisez des exportateurs Prometheus avec Google Cloud Managed Service pour Prometheus.

Vous pouvez également écrire des exportateurs personnalisés pour surveiller d'autres signaux d'état et de performances.

Utiliser les données collectées

Utilisez les données que vous collectez pour analyser l'état des applications, déboguer, dépanner et tester vos applications lors du développement, du déploiement et de la maintenance.

GKE fournit des fonctionnalités d'observabilité intégrées pour vous aider à démarrer rapidement :

Affichez les données collectées pour vos clusters et charges de travail dans les tableaux de bord d'observabilité de GKE. Vous pouvez personnaliser les tableaux de bord fournis aux fins suivantes :
- Afficher les métriques clés du cluster, telles que l'utilisation du processeur, de la mémoire, ainsi que le nombre d'incidents ouverts.
- Affichez les clusters en fonction de leur infrastructure, de leurs charges de travail ou de leurs services.
- Inspectez les espaces de noms, les nœuds, les charges de travail, les services, les pods et les conteneurs.
- Pour les pods et les conteneurs, affichez les métriques en fonction du temps et affichez les entrées de journal.
Vous pouvez également créer vos propres tableaux de bord ou importer des tableaux de bord Grafana en fonction de vos besoins.

Remarque : Les tableaux de bord GKE fournis n'affichent des informations que pour les clusters GKE exécutés sur Google Cloud. Ils n'affichent pas d'informations pour les clusters GKE exécutés ailleurs, par exemple à l'aide de serveurs sur site ou bare metal.
Dans l'onglet Observabilité, vous pouvez créer des règles d'alerte recommandées pour être informé en cas de problème. Pour en savoir plus sur les alertes, consultez la présentation des alertes.
Créez des SLO pour surveiller vos objectifs de performances de service à l'aide des métriques GKE collectées.
Utilisez les playbooks GKE pour résoudre les problèmes courants tels que les pods non programmables et les conteneurs qui plantent plusieurs fois après le redémarrage.
Explorer et analyser vos données avec des outils tels que l'Explorateur de journaux, l'Explorateur de métriques et Error Reporting.
Consultez les journaux d'audit GKE qui enregistrent les activités d'administration et les accès dans le cadre de Cloud Audit Logs. La stratégie de journal d'audit détermine les événements enregistrés et si une entrée appartient à un journal d'activité d'administration ou à un journal d'accès aux données.

Autres fonctionnalités

GKE s'intègre à d'autres services Google Cloud pour vous aider à surveiller et à gérer vos clusters et vos charges de travail.

Utilisez le tableau de bord de stratégie de sécurité pour identifier les problèmes de sécurité basés sur nos normes et les bonnes pratiques du secteur.
Affichez des insights et des recommandations pour optimiser vos clusters.
Utilisez la journalisation des règles de réseau pour vous aider à résoudre les problèmes liés aux règles de réseau Kubernetes. Si vous utilisez GKE Dataplane V2, la journalisation des règles de réseau est intégrée.

Tarification

La tarification de l'intégration à Cloud Logging (y compris Cloud Audit Logs), à Cloud Monitoring et à Google Cloud Managed Service pour Prometheus est basée sur la quantité de journaux et de métriques collectés. Consultez la page des tarifs pour plus d'informations.

Les fonctionnalités fournies par d'autres services Google Cloud répertoriés dans la section Autres fonctionnalités sont soumises à des tarifs distincts. Consultez la section Tarifs de ces pages de documentation pour plus d'informations.

Étapes suivantes

Configurez la journalisation et la surveillance dans les clusters nouveaux et existants.
Observez vos clusters. Apprenez à afficher des tableaux de bord, à organiser les informations sur les clusters et à afficher les détails des alertes.
Activez la journalisation détaillée au niveau du système d'exploitation sur les nœuds de cluster GKE et découvrez comment exporter des journaux vers Cloud Logging.