Beobachtbarkeit bezieht sich auf Systemmonitoring, Logging, Benachrichtigungen und andere Trackinginformationen, mit denen der Status und die Integrität von Infrastruktur und Diensten angezeigt werden. Die Komponenten für die Beobachtbarkeit der Air-Gap-Appliance von Google Distributed Cloud (GDC) erfassen Logs und Messwerte, die in Grafana-Dashboards sichtbar werden und die Sie abfragen können, um betriebliche Probleme zu erkennen.
Plattformadministratoren können die Observability-Plattform verwenden, um System- und Nutzercluster zu überwachen und Logs und Messwerte in der Grafana-Benutzeroberfläche zu visualisieren. Anwendungsoperatoren können Monitoring- und Betriebsdaten in Form von Logs, Messwerten und Ereignissen für ihre Anwendungen erfassen.
Die Observability-Plattform stellt ihre Stackkomponenten im Administrator- und Nutzercluster bereit. Die Grafana-Instanz für Plattformadministratoren umfasst Messwerte auf Organisationsebene, z. B. CPU-Auslastung und Speicherverbrauch, sowie Benachrichtigungen, Logs und Messwerte der betriebsbereiten Komponenten von Administrator-, System- und Nutzerclustern in GDC.
Die Grafana-Instanz für Application Operators enthält keine Standard-Dashboards oder ‑Logs für Ihr Projekt. Wenn Sie Dashboards erstellen, sind sie nur sichtbar, wenn Sie die Erfassung von Messwerten für Ihr Projekt aktivieren.
Plattformkomponenten
Die GDC-Monitoring- und Logging-Stacks enthalten Open-Source-Dienste als Teil der Observability-Plattform. Diese Dienste erfassen Logs von Kubernetes-Pods, Bare-Metal-Maschinen, Netzwerk-Switches und Speichergeräten.
In der folgenden Tabelle finden Sie Details zu den einzelnen Observability-Komponenten.
Komponente | Typ | Cluster | Beschreibung |
---|---|---|---|
anthos-prometheus-k8s |
StatefulSet | Nur System | Prometheus (https://prometheus.io/docs/introduction/overview ): Eine Zeitreihendatenbank zum Erfassen und Speichern von Messwerten und zum Auswerten von Benachrichtigungen. Es fügt Labels als Schlüssel/Wert-Paare hinzu und erfasst Messwerte von Kubernetes-Knoten, Pods, Bare-Metal-Maschinen, Netzwerk-Switches und Speichergeräten. In der Datenbank werden Messwerte aus dem Nutzercluster im selben Cluster gespeichert und Messwerte aus allen Clustern im Administratorcluster aggregiert. |
grafana |
StatefulSet | Nur System | Grafana (https://grafana.com/docs/grafana/latest/): Eine Benutzeroberfläche zum Visualisieren von Dashboards mit Messwerten und Benachrichtigungen. Messwerte ansehen, die von Prometheus erfasst werden, und Logs aus Loki abfragen Damit können Nutzer Dashboards mit Messwerten und Benachrichtigungen visualisieren. |
alertmanager |
StatefulSet | Nur System | Alertmanager (https://prometheus.io/docs/alerting/latest/alertmanager/): Ein benutzerdefinierter Manager, der Benachrichtigungen sendet, wenn Protokolle oder Messwerte darauf hinweisen, dass Systemkomponenten ausfallen oder nicht normal funktionieren. Er verwaltet das Routing, die Stummschaltung und die Aggregation von Prometheus-Benachrichtigungen. |
loki |
StatefulSet | Nur System | Loki (https://grafana.com/docs/loki/latest/): Eine Zeitreihendatenbank zum Speichern von Logs aus verschiedenen Komponenten und zum Aggregieren von Logs aus allen Clustern. |
audit-logs-loki |
StatefulSet | Nur System | Loki: Eine sekundäre Instanz zum Erfassen von Langzeit-Logs, die für Prüfzwecke erforderlich sind. Es werden Logs aus allen Clustern zusammengefasst. |
anthos-log-forwarder |
DaemonSet | Alle Cluster | Fluent Bit (https://docs.fluentbit.io/manual): Ein Prozessor, der Logs aus verschiedenen Komponenten abruft und in Loki einfügt. Es erfasst Protokolle von verschiedenen Standorten und verarbeitet und leitet sie dann weiter. Es wird auf jedem Knoten aller Cluster ausgeführt. |
anthos-audit-logs-forwarder |
DaemonSet | Alle Cluster | Fluent Bit: Eine sekundäre Instanz zum Laden von Logs mit längerer Lebensdauer für Auditzwecke. |
audit-log-failure-detector |
DaemonSet | Alle Cluster | Eine GDC-Komponente, die Fehler beim Erfassen von Audit-Logs erkennt und meldet. Es wird auf jedem Knoten aller Cluster ausgeführt. |
logmon-operator |
Bereitstellung | Alle Cluster | Der GDC Logmon -Operator, der Observability-Stack-Komponenten bereitstellt. |
GDC nutzt auch benutzerdefinierte Ressourcen, die von GKE Enterprise für die Konfiguration von Logging und Monitoring entwickelt wurden. Mit diesen benutzerdefinierten Ressourcen können Sie Prometheus-Extraktionsziele und ‑Benachrichtigungsregeln, Alertmanager-Konfigurationen, Grafana-Dashboards und Logs-Extraktionsziele konfigurieren.