Beobachtbarkeit – Übersicht

Beobachtbarkeit bezieht sich auf Systemmonitoring, Logging, Benachrichtigungen und andere Trackinginformationen, mit denen der Status und die Integrität von Infrastruktur und Diensten angezeigt werden. Die Komponenten für die Beobachtbarkeit der Air-Gap-Appliance von Google Distributed Cloud (GDC) erfassen Logs und Messwerte, die in Grafana-Dashboards sichtbar werden und die Sie abfragen können, um betriebliche Probleme zu erkennen.

Plattformadministratoren können die Observability-Plattform verwenden, um System- und Nutzercluster zu überwachen und Logs und Messwerte in der Grafana-Benutzeroberfläche zu visualisieren. Anwendungsoperatoren können Monitoring- und Betriebsdaten in Form von Logs, Messwerten und Ereignissen für ihre Anwendungen erfassen.

Die Observability-Plattform stellt ihre Stackkomponenten im Administrator- und Nutzercluster bereit. Die Grafana-Instanz für Plattformadministratoren umfasst Messwerte auf Organisationsebene, z. B. CPU-Auslastung und Speicherverbrauch, sowie Benachrichtigungen, Logs und Messwerte der betriebsbereiten Komponenten von Administrator-, System- und Nutzerclustern in GDC.

Die Grafana-Instanz für Application Operators enthält keine Standard-Dashboards oder ‑Logs für Ihr Projekt. Wenn Sie Dashboards erstellen, sind sie nur sichtbar, wenn Sie die Erfassung von Messwerten für Ihr Projekt aktivieren.

Plattformkomponenten

Die GDC-Monitoring- und Logging-Stacks enthalten Open-Source-Dienste als Teil der Observability-Plattform. Diese Dienste erfassen Logs von Kubernetes-Pods, Bare-Metal-Maschinen, Netzwerk-Switches und Speichergeräten.

In der folgenden Tabelle finden Sie Details zu den einzelnen Observability-Komponenten.

Komponente Typ Cluster Beschreibung
anthos-prometheus-k8s StatefulSet Nur System Prometheus (https://prometheus.io/docs/introduction/overview ):
Eine Zeitreihendatenbank zum Erfassen und Speichern von Messwerten und zum Auswerten von Benachrichtigungen. Es fügt Labels als Schlüssel/Wert-Paare hinzu und erfasst Messwerte von Kubernetes-Knoten, Pods, Bare-Metal-Maschinen, Netzwerk-Switches und Speichergeräten. In der Datenbank werden Messwerte aus dem Nutzercluster im selben Cluster gespeichert und Messwerte aus allen Clustern im Administratorcluster aggregiert.
grafana StatefulSet Nur System Grafana (https://grafana.com/docs/grafana/latest/):
Eine Benutzeroberfläche zum Visualisieren von Dashboards mit Messwerten und Benachrichtigungen. Messwerte ansehen, die von Prometheus erfasst werden, und Logs aus Loki abfragen Damit können Nutzer Dashboards mit Messwerten und Benachrichtigungen visualisieren.
alertmanager StatefulSet Nur System Alertmanager (https://prometheus.io/docs/alerting/latest/alertmanager/):
Ein benutzerdefinierter Manager, der Benachrichtigungen sendet, wenn Protokolle oder Messwerte darauf hinweisen, dass Systemkomponenten ausfallen oder nicht normal funktionieren. Er verwaltet das Routing, die Stummschaltung und die Aggregation von Prometheus-Benachrichtigungen.
loki StatefulSet Nur System Loki (https://grafana.com/docs/loki/latest/):
Eine Zeitreihendatenbank zum Speichern von Logs aus verschiedenen Komponenten und zum Aggregieren von Logs aus allen Clustern.
audit-logs-loki StatefulSet Nur System Loki:
Eine sekundäre Instanz zum Erfassen von Langzeit-Logs, die für Prüfzwecke erforderlich sind. Es werden Logs aus allen Clustern zusammengefasst.
anthos-log-forwarder DaemonSet Alle Cluster Fluent Bit (https://docs.fluentbit.io/manual):
Ein Prozessor, der Logs aus verschiedenen Komponenten abruft und in Loki einfügt. Es erfasst Protokolle von verschiedenen Standorten und verarbeitet und leitet sie dann weiter. Es wird auf jedem Knoten aller Cluster ausgeführt.
anthos-audit-logs-forwarder DaemonSet Alle Cluster Fluent Bit:
Eine sekundäre Instanz zum Laden von Logs mit längerer Lebensdauer für Auditzwecke.
audit-log-failure-detector DaemonSet Alle Cluster Eine GDC-Komponente, die Fehler beim Erfassen von Audit-Logs erkennt und meldet. Es wird auf jedem Knoten aller Cluster ausgeführt.
logmon-operator Bereitstellung Alle Cluster Der GDC Logmon-Operator, der Observability-Stack-Komponenten bereitstellt.

GDC nutzt auch benutzerdefinierte Ressourcen, die von GKE Enterprise für die Konfiguration von Logging und Monitoring entwickelt wurden. Mit diesen benutzerdefinierten Ressourcen können Sie Prometheus-Extraktionsziele und ‑Benachrichtigungsregeln, Alertmanager-Konfigurationen, Grafana-Dashboards und Logs-Extraktionsziele konfigurieren.