Auf dieser Seite wird beschrieben, wie Sie auf die Systemstatus-Dashboards zugreifen, um potenzielle Probleme zu überwachen und zu identifizieren.
Der Gesundheitsstatus hilft Ihnen, die wichtigsten Messwerte Ihrer Google Distributed Cloud-Appliance-Infrastruktur (GDC) zu visualisieren, und bietet einen allgemeinen Überblick über den Status der Komponenten. Durch die Visualisierung von Dashboards zum Integritätsstatus können Sie Ursachen ermitteln, Verhaltensweisen diagnostizieren und während der Untersuchung zur Behebung von Problemen zusätzlichen Kontext erhalten.
GDC überwacht den Systemstatus jeder Hardware- und Softwarekomponente und stellt ihn bereit. Dazu gehören:
- Hardware: Serverknoten
- Software: Cluster, VMs und Speicher
Mit Dashboards für den Systemstatus können Sie die Messwerte visualisieren, mit denen der Monitoring-Status der einzelnen Komponenten gemessen wird.
Hinweise
Die Root-Cluster enthalten eine Grafana-Instanz für Infrastrukturbetreiber. Diese Grafana-Instanzen enthalten die Dashboards für den Integritätsstatus.
Sie benötigen eine rollenbasierte Zugriffssteuerung, um sicher auf Datenvisualisierungen in Dashboards der Grafana-Instanz zuzugreifen. Folgen Sie daher der Anleitung im Abschnitt Vorbereitung, um Messwerte in Dashboards abzufragen und anzusehen.
Grafana-Endpunkt
Öffnen Sie eine der folgenden URLs, um auf den Grafana-Endpunkt des Projekts infra-obs
oder des Administrator-Root-Clusters zuzugreifen:
Grafana-Endpunkt des Projekts
infra-obs
:https://GDC_URL/infra-obs/grafana
Ersetzen Sie GDC_URL durch die URL einer Organisation in GDC.
Grafana-Endpunkt des Administrator-Root-Clusters:
https://ROOT_ADMIN_CLUSTER_URL/grafana
Ersetzen Sie ROOT_ADMIN_CLUSTER_URL durch die URL des Stammadministratorclusters in GDC.
Anwendungsbeispiele
In diesem Abschnitt finden Sie Beispiele für die praktische Anwendung des Dashboards.
Leistungsoptimierung
Wenn eine Komponente eine schlechte Leistung erbringt, aber nicht unbedingt das SLO beeinträchtigt oder Warnungen auslöst, können Sie Entwickler proaktiv informieren und zukünftige Probleme verhindern.
Ebenso möchte eine Komponente möglicherweise wissen, wie ihre Funktion funktioniert, um die richtigen Leistungsentscheidungen zu treffen. Der Gesundheitsstatus ist ein Mechanismus zum Erfassen der Informationen, die Komponenten benötigen.
Funktionsentwicklung
Angenommen, ein Kunde fordert Änderungen an oder GDC plant die Einführung einer neuen Funktion. In diesem Fall können Sie den Systemzustand der relevanten Komponenten beobachten, um festzustellen, ob die neue Funktion oder Änderung unterstützt werden kann. Der Status kann auch verwendet werden, um Produktentscheidungen zu treffen, wenn die Arbeit priorisiert wird.
Angenommen, eine Komponente hat eine durchschnittliche Latenz von 500 ms und das Team möchte sie auf 250 ms reduzieren. In diesem Fall kann das Team die relativen Kosten einer inkrementellen Reduzierung um 50% berechnen und mit den Kosten für das Design eines Endpunkts mit einer Reaktionszeit von 250 ms vergleichen.