Utiliser Google Cloud Managed Service pour Prometheus pour collecter les métriques tierces et définies par l'utilisateur configurées, puis les envoyer à Cloud Monitoring. Google Cloud Managed Service pour Prometheus vous permet de surveiller vos charges de travail et d'envoyer des alertes à l'aide de Prometheus, sans avoir à gérer et exploiter manuellement Prometheus à grande échelle.
Personnaliser et améliorer la collecte de données
Par défaut, GKE crée un dépôt Logging pour stocker les journaux de chaque cluster. Vous pouvez contrôler les journaux et les métriques, le cas échéant, envoyées depuis votre cluster GKE vers Cloud Logging et Cloud Monitoring.
Métriques du plan de contrôle : surveillez l'état des composants Kubernetes en collectant des métriques pour le serveur d'API Kubernetes, le programmeur et le gestionnaire de contrôleurs. Ces métriques sont des signaux utiles de l'état du service pour définir des objectifs de niveau de service (SLO).
Kube State Metrics : surveillez l'état des objets Kubernetes tels que les déploiements, les nœuds et les pods.
Pour surveiller les applications tierces s'exécutant sur vos clusters, telles que Postgres, MongoDB et Redis, utilisez des exportateurs Prometheus avec Google Cloud Managed Service pour Prometheus.
Utilisez les données que vous collectez pour analyser l'état des applications, déboguer, dépanner et tester vos applications lors du développement, du déploiement et de la maintenance.
GKE fournit des fonctionnalités d'observabilité intégrées pour vous aider à démarrer rapidement :
Affichez les données collectées pour vos clusters et charges de travail dans les tableaux de bord d'observabilité de GKE.
Vous pouvez personnaliser les tableaux de bord fournis aux fins suivantes :
Afficher les métriques clés du cluster, telles que l'utilisation du processeur, de la mémoire, ainsi que le nombre d'incidents ouverts.
Affichez les clusters en fonction de leur infrastructure, de leurs charges de travail ou de leurs services.
Inspectez les espaces de noms, les nœuds, les charges de travail, les services, les pods et les conteneurs.
Pour les pods et les conteneurs, affichez les métriques en fonction du temps et affichez les entrées de journal.
Dans l'onglet Observabilité, vous pouvez créer des règles d'alerte recommandées pour être informé en cas de problème. Pour en savoir plus sur les alertes, consultez la présentation des alertes.
Créez des SLO pour surveiller vos objectifs de performances de service à l'aide des métriques GKE collectées.
Consultez les journaux d'audit GKE qui enregistrent les activités d'administration et les accès dans le cadre de Cloud Audit Logs.
La stratégie de journal d'audit détermine les événements enregistrés et si une entrée appartient à un journal d'activité d'administration ou à un journal d'accès aux données.
Autres caractéristiques
GKE s'intègre à d'autres services Google Cloud pour vous aider à surveiller et à gérer vos clusters et vos charges de travail.
Utilisez la journalisation des règles de réseau pour vous aider à résoudre les problèmes liés aux règles de réseau Kubernetes. Si vous utilisez GKE Dataplane V2, la journalisation des règles de réseau est intégrée.
Tarifs
La tarification de l'intégration à Cloud Logging (y compris Cloud Audit Logs), à Cloud Monitoring et à Google Cloud Managed Service pour Prometheus est basée sur la quantité de journaux et de métriques collectés. Consultez la page des tarifs pour plus d'informations.
Les fonctionnalités fournies par d'autres services Google Cloud répertoriés dans la section Autres fonctionnalités sont soumises à des tarifs distincts. Consultez la section Tarifs de ces pages de documentation pour plus d'informations.
Étapes suivantes
Observez vos clusters.
Apprenez à afficher des tableaux de bord, à organiser les informations sur les clusters et à afficher les détails des alertes.
Pour savoir comment utiliser les fonctionnalités d'observabilité pour résoudre les problèmes liés à GKE, consultez Présentation du dépannage de GKE.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["[Autopilot](/kubernetes-engine/docs/concepts/autopilot-overview) [Standard](/kubernetes-engine/docs/concepts/choose-cluster-mode)\n\n*** ** * ** ***\n\nThis page describes how you can understand the health of your applications and\nmaintain application availability and reliability.\n\nDefault observability features\n\nBy default, GKE clusters are configured to do the following:\n\n- Send [system logs, audit logs, and application logs](/kubernetes-engine/docs/concepts/about-logs#what_logs) to Cloud Logging.\n- Send [system metrics](/kubernetes-engine/docs/how-to/configure-metrics#system-metrics) to Cloud Monitoring.\n- Use [Google Cloud Managed Service for Prometheus](/stackdriver/docs/managed-prometheus) to collect configured third-party and user-defined metrics and then send them to Cloud Monitoring. Google Cloud Managed Service for Prometheus lets you monitor and alert on your workloads using Prometheus, without manually managing and operating Prometheus at scale.\n\nCustomize and enhance data collection\n\nBy default, GKE creates a Logging repository for\nstoring logs for each cluster. You can control which logs and which metrics, if\nany, are sent from your GKE cluster to Cloud Logging and\nCloud Monitoring.\n\nYou can also control whether to enable\n[Google Cloud Managed Service for Prometheus](/stackdriver/docs/managed-prometheus).\n\nFor GKE Autopilot clusters, you cannot disable\nthe Cloud Monitoring and Cloud Logging integration.\n\nAdditional observability metrics\n\nYou can collect additional observability metrics by enabling one or more\n[observability metrics packages](/kubernetes-engine/docs/how-to/configure-metrics).\n\n- [Control plane metrics](/kubernetes-engine/docs/how-to/control-plane-metrics): Monitor the health of Kubernetes components by collecting metrics for the Kubernetes API server, Scheduler, and Controller Manager. These metrics are useful signals of service health for defining service level objectives (SLOs).\n- [Kube state metrics](/kubernetes-engine/docs/how-to/kube-state-metrics): Monitor the health of Kubernetes objects such as Deployments, Nodes, and Pods.\n- [cAdvisor/Kubelet metrics](/kubernetes-engine/docs/how-to/cadvisor-kubelet-metrics): Monitor the health of containers and the kubelet.\n\nThird-party and user-defined metrics\n\nTo monitor third-party applications running on your clusters such as Postgres,\nMongoDB, and Redis, use\n[Prometheus exporters](/stackdriver/docs/managed-prometheus/exporters/introduction)\nwith Google Cloud Managed Service for Prometheus.\n\nYou can also\n[write custom exporters](https://prometheus.io/docs/instrumenting/writing_exporters/)\nto monitor other signals of health and performance.\n\nUse collected data\n\nUse the data you collect to analyze application health, debug, troubleshoot,\nand test as you develop, deploy, and maintain your applications.\n\nGKE provides built-in observability features to get you started\nquickly:\n\n- View collected data for your clusters and workloads on in\n GKE\n [observability dashboards](/kubernetes-engine/docs/how-to/view-observability-metrics).\n You can customize the provided dashboards for the following purposes:\n\n - View key cluster metrics, such as CPU utilization, memory utilization, and the number of open incidents.\n - View clusters by their infrastructure, workloads, or Services.\n - Inspect namespaces, Nodes, workloads, Services, Pods, and containers.\n - For Pods and containers, view metrics as a function of time and view log entries.\n\n You can also [create your own dashboards](/monitoring/charts/dashboards) or\n [import Grafana dashboards](/monitoring/dashboards/import-grafana-dashboards)\n to meet your needs.\n | **Note:** The provided GKE dashboards only display information for GKE clusters running on Google Cloud. They don't display information for GKE clusters running anywhere else, for example using on-premises or bare-metal servers.\n- From the **Observability** tab, you can create recommended alert policies so\n that you are notified about issues. To learn more about alerting, see the\n [Alerting overview](/monitoring/alerts).\n\n- [Create SLOs](/stackdriver/docs/solutions/slo-monitoring/ui/create-slo) to\n monitor your service performance goals using collected GKE\n metrics.\n\n- Use GKE playbooks to troubleshoot common issues such as\n [unschedulable Pods](/kubernetes-engine/docs/troubleshooting/deployed-workloads#PodUnschedulable)\n and\n [containers that repeatedly crash after restart](/kubernetes-engine/docs/troubleshooting/deployed-workloads#CrashLoopBackOff).\n\n- Explore and analyze your data with tools such as\n [Logs Explorer](/logging/docs/view/logs-explorer-interface),\n [Metrics Explorer](/monitoring/charts/metrics-explorer) and\n [Error Reporting](/error-reporting/docs/grouping-errors).\n\n- Review GKE\n [audit logs](/kubernetes-engine/docs/how-to/audit-logging) that record\n administrative activities and accesses as part of\n [Cloud Audit Logs](/logging/docs/audit).\n [Audit log policy](/kubernetes-engine/docs/concepts/audit-policy) determines\n which events are recorded and whether a log entry belongs to an Admin Activity\n log or a Data Access log.\n\nOther features\n\nGKE integrates with other Google Cloud services to help you\nmonitor and manage your clusters and workloads.\n\n- Use the\n [security posture dashboard](/kubernetes-engine/docs/concepts/about-security-posture-dashboard)\n to identify security concerns based on our standards and industry best\n practices.\n\n- View\n [insights and recommendations](/kubernetes-engine/docs/how-to/optimize-with-recommenders)\n to optimize your clusters.\n\n- Use\n [network policy logging](/kubernetes-engine/docs/how-to/network-policy-logging)\n to help you troubleshoot issues with Kubernetes network policies. If you use\n [GKE Dataplane V2](/kubernetes-engine/docs/concepts/dataplane-v2), then\n network policy logging is built-in.\n\nPricing\n\nPricing for integration with Cloud Logging (including\nCloud Audit Logs), Cloud Monitoring, and Google Cloud Managed Service for Prometheus is\nbased on the amount of logs and metrics collected. See the\n[Pricing](/stackdriver/pricing) page for details.\n\nFeatures provided by other Google Cloud services listed in\n[Other features](#other-features) have separate pricing. See the Pricing section\nof those documentation pages for more information.\n\nWhat's next\n\n- [Observe your clusters](/kubernetes-engine/docs/how-to/view-observability-metrics).\n Learn how to view dashboards, organize cluster information, and view alerting\n details.\n\n- [Enable verbose, OS-level audit logging](/kubernetes-engine/docs/how-to/linux-auditd-logging)\n on GKE cluster nodes and how to export logs to\n Cloud Logging.\n\n- For more information about how to use observability features to troubleshoot\n GKE, see\n [Introduction to GKE troubleshooting](/kubernetes-engine/docs/troubleshooting/introduction)."]]