Beobachtbarkeit für GKE

Auf dieser Seite wird beschrieben, wie Sie den Status Ihrer Anwendungen verstehen und die Verfügbarkeit und Zuverlässigkeit der Anwendung aufrechterhalten können.

Wenn Sie einen GKE-Cluster erstellen, sind Cloud Logging, Cloud Monitoring und Google Cloud Managed Service for Prometheus standardmäßig aktiviert und bieten Beobachtbarkeit, die speziell auf Kubernetes zugeschnitten ist.

  • Mit den integrierten Dashboards können Sie sich Standardmesswerte und -logs ansehen und empfohlene Benachrichtigungen einrichten.
  • Aktivieren Sie zusätzliche Beobachtbarkeitspakete, um Kubernetes-Komponenten und -Objekte zu überwachen und erfasste Daten für das Debugging und die Fehlerbehebung zu verwenden.
  • Konfigurieren Sie die Datenerfassung für Anwendungen von Drittanbietern, die in Ihren Clustern ausgeführt werden.
  • Definieren Sie eigene Messwerte, Dashboards und Benachrichtigungen, um Ihren Anforderungen gerecht zu werden.

Zusätzlich zur Einbindung in Cloud Logging und Cloud Monitoring bietet GKE auch andere Features, mit denen Sie den Zustand Ihrer Anwendungen beobachten und verwalten können.

Standardfunktionen für die Beobachtbarkeit

Standardmäßig sind GKE-Cluster für Folgendes konfiguriert:

  • Senden von Systemlogs, Audit-Logs und Anwendungslogs an Cloud Logging.
  • Senden Sie Systemmesswerte an Cloud Monitoring.
  • Verwenden Sie Google Cloud Managed Service for Prometheus, um konfigurierte Messwerte von Drittanbietern und benutzerdefinierte Messwerte zu erfassen und an Cloud Monitoring zu senden. Mit Google Cloud Managed Service for Prometheus können Sie Ihre Arbeitslasten mithilfe von Prometheus überwachen und Benachrichtigen dazu senden, ohne Prometheus manuell in großem Umfang verwalten und betreiben zu müssen.

Datenerhebung anpassen und verbessern

Sie können steuern, welche Logs und welche Messwerte gegebenenfalls von Ihrem GKE-Cluster an Cloud Logging und Cloud Monitoring gesendet werden.

Sie können auch steuern, ob Google Cloud Managed Service for Prometheus aktiviert werden soll. Konfigurationsanweisungen finden Sie unter Logging und Monitoring für GKE konfigurieren.

Hinweis: Für GKE Autopilot-Cluster können Sie die Cloud Monitoring- und Cloud Logging-Einbindung nicht deaktivieren.

Zusätzliche Beobachtbarkeitsmesswerte

Sie können zusätzliche Beobachtbarkeitsmesswerte erfassen, indem Sie ein oder mehrere Pakete für Messwerte zur Beobachtbarkeit aktivieren:

  • Messwerte der Steuerungsebene: Überwachen Sie den Zustand von Kubernetes-Komponenten, indem Sie Messwerte für den Kubernetes API-Server, den Planer und den Controller-Manager erfassen. Diese Messwerte sind nützliche Signale für den Dienststatus, um Service Level Objectives (SLOs) zu definieren.
  • Kube-Statusmesswerte: Zustand von Kubernetes-Objekten wie Bereitstellungen, Knoten und Pods überwachen.

Wenn Sie GKE Enterprise in Ihrem Projekt aktiviert haben, sind diese Messwerte standardmäßig aktiviert, wenn Sie sich während der Clustererstellung bei einer Flotte registrieren.

Drittanbieter- und benutzerdefinierte Messwerte

Zum Überwachen von Drittanbieteranwendungen, die auf Ihren Clustern ausgeführt werden, wie etwa Postgres, MongoDB und Redis, verwenden Sie Prometheus-Exporteure mit Google Cloud Managed Service for Prometheus.

Sie können auch benutzerdefinierte Exporter schreiben, um andere Signale in Bezug auf Zustand und Leistung zu überwachen.

Erfasste Daten verwenden

Mit den erfassten Daten können Sie den Zustand Ihrer Anwendungen analysieren, Fehler beheben, Fehler beheben und Tests durchführen, während Sie Anwendungen entwickeln, bereitstellen und warten.

GKE bietet integrierte Beobachtbarkeitsfeatures, die Ihnen einen schnellen Einstieg ermöglichen:

  • Erfasste Daten für Ihre Cluster und Arbeitslasten in GKE-Beobachtbarkeits-Dashboards ansehen. Sie können die bereitgestellten Dashboards für folgende Zwecke anpassen:

    • Rufen Sie wichtige Clustermesswerte wie CPU-Auslastung, Speicherauslastung und die Anzahl der offenen Vorfälle auf.
    • Cluster nach Infrastruktur, Arbeitslasten oder Diensten anzeigen.
    • Prüfen Sie Namespaces, Knoten, Arbeitslasten, Dienste, Pods und Container.
    • Sehen Sie sich für Pods und Container Messwerte als Zeitfunktion sowie Logeinträge an.

    Sie können auch eigene Dashboards erstellen oder Grafana-Dashboards importieren, um Ihre Anforderungen zu erfüllen.

  • Auf dem Tab Beobachtbarkeit können Sie empfohlene Benachrichtigungsrichtlinien erstellen, um über Probleme informiert zu werden. Weitere Informationen zu Benachrichtigungen finden Sie in der Übersicht zu Benachrichtigungen.

  • Erstellen Sie SLOs, um die Leistungsziele Ihrer Dienste mithilfe erfasster GKE-Messwerte zu überwachen.

  • Verwenden Sie GKE-Playbooks, um häufige Probleme wie nicht planbare Pods und Container, die nach dem Neustart wiederholt abstürzen zu beheben.

  • Untersuchen und analysieren Sie Ihre Daten mit Tools wie Log-Explorer, Metrics Explorer und Error Reporting.

  • Prüfen Sie die Audit-Logs von GKE, in denen Verwaltungsaktivitäten und Zugriffe als Teil von Cloud-Audit-Logs aufgezeichnet werden. Audit-Log-Richtlinien legen fest, welche Ereignisse aufgezeichnet werden und ob ein Logeintrag zu einem Administratoraktivitätslog oder zu einem Datenzugriffslog gehört.

Sonstige Features

GKE lässt sich in andere Google Cloud-Dienste einbinden, um Sie bei der Überwachung und Verwaltung Ihrer Cluster und Arbeitslasten zu unterstützen.

Nächste Schritte