Diese Seite wurde von der Cloud Translation API übersetzt.

Beobachtbarkeit – Übersicht

Beobachtbarkeit bezieht sich auf Systemmonitoring, Logging, Benachrichtigungen und andere Trackinginformationen, mit denen der Status und die Integrität von Infrastruktur und Diensten angezeigt werden. Die Komponenten für die Beobachtbarkeit der Air-Gap-Appliance von Google Distributed Cloud (GDC) erfassen Logs und Messwerte, die in Grafana-Dashboards sichtbar werden und die Sie abfragen können, um betriebliche Probleme zu erkennen.

Plattformadministratoren können die Observability-Plattform verwenden, um System- und Nutzercluster zu überwachen und Logs und Messwerte in der Grafana-Benutzeroberfläche zu visualisieren. Anwendungsoperatoren können Monitoring- und Betriebsdaten in Form von Logs, Messwerten und Ereignissen für ihre Anwendungen erfassen.

Die Observability-Plattform stellt ihre Stackkomponenten im Administrator- und Nutzercluster bereit. Die Grafana-Instanz für Plattformadministratoren umfasst Messwerte auf Organisationsebene, z. B. CPU-Auslastung und Speicherverbrauch, sowie Benachrichtigungen, Logs und Messwerte der betriebsbereiten Komponenten von Administrator-, System- und Nutzerclustern in GDC.

Die Grafana-Instanz für Application Operators enthält keine Standard-Dashboards oder ‑Logs für Ihr Projekt. Wenn Sie Dashboards erstellen, sind sie nur sichtbar, wenn Sie die Erfassung von Messwerten für Ihr Projekt aktivieren.

Plattformkomponenten

Die GDC-Monitoring- und Logging-Stacks enthalten Open-Source-Dienste als Teil der Observability-Plattform. Diese Dienste erfassen Logs von Kubernetes-Pods, Bare-Metal-Maschinen, Netzwerk-Switches und Speichergeräten.

In der folgenden Tabelle finden Sie Details zu den einzelnen Observability-Komponenten.

Komponente	Typ	Cluster	Beschreibung
`anthos-prometheus-k8s`	StatefulSet	Nur System	Prometheus (https://prometheus.io/docs/introduction/overview ): Eine Zeitreihendatenbank zum Erfassen und Speichern von Messwerten und zum Auswerten von Benachrichtigungen. Es fügt Labels als Schlüssel/Wert-Paare hinzu und erfasst Messwerte von Kubernetes-Knoten, Pods, Bare-Metal-Maschinen, Netzwerk-Switches und Speichergeräten. In der Datenbank werden Messwerte aus dem Nutzercluster im selben Cluster gespeichert und Messwerte aus allen Clustern im Administratorcluster aggregiert.
`grafana`	StatefulSet	Nur System	Grafana (https://grafana.com/docs/grafana/latest/): Eine Benutzeroberfläche zum Visualisieren von Dashboards mit Messwerten und Benachrichtigungen. Messwerte ansehen, die von Prometheus erfasst werden, und Logs aus Loki abfragen Damit können Nutzer Dashboards mit Messwerten und Benachrichtigungen visualisieren.
`alertmanager`	StatefulSet	Nur System	Alertmanager (https://prometheus.io/docs/alerting/latest/alertmanager/): Ein benutzerdefinierter Manager, der Benachrichtigungen sendet, wenn Protokolle oder Messwerte darauf hinweisen, dass Systemkomponenten ausfallen oder nicht normal funktionieren. Er verwaltet das Routing, die Stummschaltung und die Aggregation von Prometheus-Benachrichtigungen.
`loki`	StatefulSet	Nur System	Loki (https://grafana.com/docs/loki/latest/): Eine Zeitreihendatenbank zum Speichern von Logs aus verschiedenen Komponenten und zum Aggregieren von Logs aus allen Clustern.
`audit-logs-loki`	StatefulSet	Nur System	Loki: Eine sekundäre Instanz zum Erfassen von Langzeit-Logs, die für Prüfzwecke erforderlich sind. Es werden Logs aus allen Clustern zusammengefasst.
`anthos-log-forwarder`	DaemonSet	Alle Cluster	Fluent Bit (https://docs.fluentbit.io/manual): Ein Prozessor, der Logs aus verschiedenen Komponenten abruft und in Loki einfügt. Es erfasst Protokolle von verschiedenen Standorten und verarbeitet und leitet sie dann weiter. Es wird auf jedem Knoten aller Cluster ausgeführt.
`anthos-audit-logs-forwarder`	DaemonSet	Alle Cluster	Fluent Bit: Eine sekundäre Instanz zum Laden von Logs mit längerer Lebensdauer für Auditzwecke.
`audit-log-failure-detector`	DaemonSet	Alle Cluster	Eine GDC-Komponente, die Fehler beim Erfassen von Audit-Logs erkennt und meldet. Es wird auf jedem Knoten aller Cluster ausgeführt.
`logmon-operator`	Bereitstellung	Alle Cluster	Der GDC `Logmon`-Operator, der Observability-Stack-Komponenten bereitstellt.

GDC nutzt auch benutzerdefinierte Ressourcen, die von GKE Enterprise für die Konfiguration von Logging und Monitoring entwickelt wurden. Mit diesen benutzerdefinierten Ressourcen können Sie Prometheus-Extraktionsziele und ‑Benachrichtigungsregeln, Alertmanager-Konfigurationen, Grafana-Dashboards und Logs-Extraktionsziele konfigurieren.