Cette page explique comment comprendre l'état de vos applications et comment maintenir leur disponibilité et leur fiabilité.
Fonctionnalités d'observabilité par défaut
Par défaut, les clusters GKE sont configurés pour effectuer les opérations suivantes :
- Envoyer les journaux système, les journaux d'audit et les journaux d'application à Cloud Logging.
- Envoyer des métriques système à Cloud Monitoring.
- Utiliser Google Cloud Managed Service pour Prometheus pour collecter les métriques tierces et définies par l'utilisateur configurées, puis les envoyer à Cloud Monitoring. Google Cloud Managed Service pour Prometheus vous permet de surveiller vos charges de travail et d'envoyer des alertes à l'aide de Prometheus, sans avoir à gérer et exploiter manuellement Prometheus à grande échelle.
Personnaliser et améliorer la collecte de données
Par défaut, GKE crée un dépôt Logging pour stocker les journaux de chaque cluster. Vous pouvez contrôler les journaux et les métriques, le cas échéant, envoyées depuis votre cluster GKE vers Cloud Logging et Cloud Monitoring.
Vous pouvez également activer ou désactiver le service géré Google Cloud pour Prometheus.
Vous ne pouvez pas désactiver l'intégration de Cloud Monitoring et Cloud Logging pour les clusters GKE Autopilot.
Métriques d'observabilité supplémentaires
Vous pouvez collecter des métriques d'observabilité supplémentaires en activant un ou plusieurs packages de métriques d'observabilité :
- Métriques du plan de contrôle : surveillez l'état des composants Kubernetes en collectant des métriques pour le serveur d'API Kubernetes, le programmeur et le gestionnaire de contrôleurs. Ces métriques sont des signaux utiles de l'état du service pour définir des objectifs de niveau de service (SLO).
- Kube State Metrics : surveillez l'état des objets Kubernetes tels que les déploiements, les nœuds et les pods.
- Métriques cAdvisor/Kubelet : surveillez l'état des conteneurs et du kubelet.
Si vous avez activé GKE Enterprise dans votre projet, ces métriques sont activées par défaut lorsque vous effectuez l'enregistrement dans un parc lors de la création du cluster.
Métriques tierces et définies par l'utilisateur
Pour surveiller les applications tierces s'exécutant sur vos clusters, telles que Postgres, MongoDB et Redis, utilisez des exportateurs Prometheus avec Google Cloud Managed Service pour Prometheus.
Vous pouvez également écrire des exportateurs personnalisés pour surveiller d'autres signaux d'état et de performances.
Utiliser les données collectées
Utilisez les données que vous collectez pour analyser l'état des applications, déboguer, dépanner et tester vos applications lors du développement, du déploiement et de la maintenance.
GKE fournit des fonctionnalités d'observabilité intégrées pour vous aider à démarrer rapidement :
Affichez les données collectées pour vos clusters et charges de travail dans les tableaux de bord d'observabilité de GKE. Vous pouvez personnaliser les tableaux de bord fournis aux fins suivantes :
- Afficher les métriques clés du cluster, telles que l'utilisation du processeur, de la mémoire, ainsi que le nombre d'incidents ouverts.
- Affichez les clusters en fonction de leur infrastructure, de leurs charges de travail ou de leurs services.
- Inspectez les espaces de noms, les nœuds, les charges de travail, les services, les pods et les conteneurs.
- Pour les pods et les conteneurs, affichez les métriques en fonction du temps et affichez les entrées de journal.
Vous pouvez également créer vos propres tableaux de bord ou importer des tableaux de bord Grafana en fonction de vos besoins.
Dans l'onglet Observabilité, vous pouvez créer des règles d'alerte recommandées pour être informé en cas de problème. Pour en savoir plus sur les alertes, consultez la présentation des alertes.
Créez des SLO pour surveiller vos objectifs de performances de service à l'aide des métriques GKE collectées.
Utilisez les playbooks GKE pour résoudre les problèmes courants tels que les pods non programmables et les conteneurs qui plantent plusieurs fois après le redémarrage.
Explorer et analyser vos données avec des outils tels que l'Explorateur de journaux, l'Explorateur de métriques et Error Reporting.
Consultez les journaux d'audit GKE qui enregistrent les activités d'administration et les accès dans le cadre de Cloud Audit Logs. La stratégie de journal d'audit détermine les événements enregistrés et si une entrée appartient à un journal d'activité d'administration ou à un journal d'accès aux données.
Autres fonctionnalités
GKE s'intègre à d'autres services Google Cloud pour vous aider à surveiller et à gérer vos clusters et vos charges de travail.
Utilisez le tableau de bord de stratégie de sécurité pour identifier les problèmes de sécurité basés sur nos normes et les bonnes pratiques du secteur.
Affichez des insights et des recommandations pour optimiser vos clusters.
Utilisez la journalisation des règles de réseau pour vous aider à résoudre les problèmes liés aux règles de réseau Kubernetes. Si vous utilisez GKE Dataplane V2, la journalisation des règles de réseau est intégrée.
Tarifs
La tarification de l'intégration à Cloud Logging (y compris Cloud Audit Logs), à Cloud Monitoring et à Google Cloud Managed Service pour Prometheus est basée sur la quantité de journaux et de métriques collectés. Consultez la page des tarifs pour plus d'informations.
Les fonctionnalités fournies par d'autres services Google Cloud répertoriés dans la section Autres fonctionnalités sont soumises à des tarifs distincts. Consultez la section Tarifs de ces pages de documentation pour plus d'informations.
Étapes suivantes
Observez vos clusters. Apprenez à afficher des tableaux de bord, à organiser les informations sur les clusters et à afficher les détails des alertes.
Activez la journalisation détaillée au niveau du système d'exploitation sur les nœuds de cluster GKE et découvrez comment exporter des journaux vers Cloud Logging.