Beobachtbarkeit für GKE


Auf dieser Seite wird beschrieben, wie Sie den Status Ihrer Anwendungen verstehen und für deren Verfügbarkeit und Zuverlässigkeit sorgen können.

Standardfunktionen zur Beobachtbarkeit

Standardmäßig sind GKE-Cluster für Folgendes konfiguriert:

  • Senden von Systemlogs, Audit-Logs und Anwendungslogs an Cloud Logging.
  • Senden Sie Systemmesswerte an Cloud Monitoring.
  • Verwenden Sie Google Cloud Managed Service for Prometheus, um konfigurierte Messwerte von Drittanbietern und benutzerdefinierte Messwerte zu erfassen und an Cloud Monitoring zu senden. Mit Google Cloud Managed Service for Prometheus können Sie Ihre Arbeitslasten mithilfe von Prometheus überwachen und Benachrichtigen dazu senden, ohne Prometheus manuell in großem Umfang verwalten und betreiben zu müssen.

Datenerhebung anpassen und optimieren

Standardmäßig erstellt GKE ein Logging-Repository zum Speichern von Logs für die einzelnen Cluster. Sie können steuern, welche Logs und welche Messwerte gegebenenfalls von Ihrem GKE-Cluster an Cloud Logging und Cloud Monitoring gesendet werden.

Sie können auch festlegen, ob Sie Google Cloud Managed Service for Prometheus aktivieren möchten.

Hinweis: Für GKE Autopilot-Cluster können Sie die Cloud Monitoring- und Cloud Logging-Einbindung nicht deaktivieren.

Zusätzliche Beobachtbarkeitsmesswerte

Sie können zusätzliche Beobachtbarkeitsmesswerte erfassen, indem Sie ein oder mehrere Pakete für Messwerte zur Beobachtbarkeit aktivieren.

  • Messwerte der Steuerungsebene: Überwachen Sie den Zustand von Kubernetes-Komponenten, indem Sie Messwerte für den Kubernetes API-Server, den Planer und den Controller-Manager erfassen. Diese Messwerte sind nützliche Signale für den Dienststatus, um Service Level Objectives (SLOs) zu definieren.
  • Kube-Statusmesswerte: Zustand von Kubernetes-Objekten wie Bereitstellungen, Knoten und Pods überwachen.
  • cAdvisor-/Kubelet-Messwerte: Überwachen Sie den Zustand von Containern und Kubelet.

Wenn Sie GKE Enterprise in Ihrem Projekt aktiviert haben, werden diese Messwerte standardmäßig aktiviert, wenn Sie sich bei der Erstellung eines Clusters bei einer Flotte registrieren.

Drittanbieter- und benutzerdefinierte Messwerte

Zum Überwachen von Drittanbieteranwendungen, die auf Ihren Clustern ausgeführt werden, wie etwa Postgres, MongoDB und Redis, verwenden Sie Prometheus-Exporteure mit Google Cloud Managed Service for Prometheus.

Sie können auch benutzerdefinierte Exporter schreiben, um andere Signale in Bezug auf Zustand und Leistung zu überwachen.

Erfasste Daten verwenden

Mit den erfassten Daten können Sie den Zustand Ihrer Anwendungen analysieren, Fehler beheben und Tests durchführen, während Sie Anwendungen entwickeln, bereitstellen und warten.

GKE bietet integrierte Beobachtbarkeitsfeatures, die Ihnen einen schnellen Einstieg ermöglichen:

  • Erfasste Daten für Ihre Cluster und Arbeitslasten in GKE-Beobachtbarkeits-Dashboards ansehen. Sie können die bereitgestellten Dashboards für folgende Zwecke anpassen:

    • Rufen Sie wichtige Clustermesswerte wie CPU-Auslastung, Speicherauslastung und die Anzahl der offenen Vorfälle auf.
    • Cluster nach Infrastruktur, Arbeitslasten oder Diensten anzeigen.
    • Prüfen Sie Namespaces, Knoten, Arbeitslasten, Dienste, Pods und Container.
    • Sehen Sie sich für Pods und Container Messwerte als Zeitfunktion sowie Logeinträge an.

    Sie können auch eigene Dashboards erstellen oder Grafana-Dashboards importieren, um Ihre Anforderungen zu erfüllen.

  • Auf dem Tab Beobachtbarkeit können Sie empfohlene Benachrichtigungsrichtlinien erstellen, damit Sie über Probleme informiert werden. Weitere Informationen zu Benachrichtigungen finden Sie in der Übersicht zu Benachrichtigungen.

  • Erstellen Sie SLOs, um die Leistungsziele Ihrer Dienste mithilfe erfasster GKE-Messwerte zu überwachen.

  • Verwenden Sie GKE-Playbooks, um häufige Probleme wie nicht planbare Pods und Container, die nach dem Neustart wiederholt abstürzen zu beheben.

  • Untersuchen und analysieren Sie Ihre Daten mit Tools wie Log-Explorer, Metrics Explorer und Error Reporting.

  • Prüfen Sie die Audit-Logs von GKE, in denen Verwaltungsaktivitäten und Zugriffe als Teil von Cloud-Audit-Logs aufgezeichnet werden. Audit-Log-Richtlinien legen fest, welche Ereignisse aufgezeichnet werden und ob ein Logeintrag zu einem Administratoraktivitätslog oder zu einem Datenzugriffslog gehört.

Weitere Funktionen

GKE lässt sich in andere Google Cloud-Dienste einbinden, um Sie bei der Überwachung und Verwaltung Ihrer Cluster und Arbeitslasten zu unterstützen.

Preise

Die Preise für die Einbindung in Cloud Logging (einschließlich Cloud-Audit-Logs), Cloud Monitoring und Google Cloud Managed Service for Prometheus basieren auf dem Umfang der erfassten Logs und Messwerte. Weitere Informationen zu den Preisen erhalten Sie in der Preisübersicht.

Für Features, die von anderen Google Cloud-Diensten bereitgestellt werden, die unter Andere Features aufgeführt sind, gelten separate Preise. Weitere Informationen finden Sie im Abschnitt "Preise" dieser Dokumentationsseiten.

Nächste Schritte