Dashboards zur Leistungsüberwachung – Übersicht

Über Dashboards zur Leistungsüberwachung erhalten Sie Einblick in die Leistung des gesamten Google Cloud-Netzwerks und die Leistung Ihrer Projektressourcen.

In der Ansicht „Projektleistung“ zeigt das Dashboard zur Leistungsüberwachung Paketverlust- und Latenzmesswerte (in Übersichtsdiagrammen und Heatmaps) für Zonen an, in denen Compute Engine-VM-Instanzen vorhanden sind. Sie enthält aktuelle Daten sowie Messwerte für die letzten sechs Wochen. Ihr Projekt hat beispielsweise ein VPC-Netzwerk (Virtual Private Cloud) mit VMs in den Zonen A und B. In einem solchen Fall liefert das Dashboard zur Leistungsüberwachung Daten zu Paketverlust und Latenzdetails Ihres Projekts zwischen diesen beiden Zonen. Klicken Sie zum Ansehen der Projektmesswerte oben auf der Seite „Dashboards zur Leistungsüberwachung“ auf Projektleistung ansehen. Weitere Beispiele und Details zu den gemessenen Messwerten finden Sie unter Messwerte.

In der Google Cloud-Leistungsansicht werden im Dashboard zur Leistungsüberwachung die Paketverlust- und Latenzmesswerte für alle Google Cloud-Produkte angezeigt. Anhand dieser Messwerte können Sie nachvollziehen, ob Probleme, die im Projekt-Dashboard auftreten, für Ihr Projekt eindeutig sind. Die globalen Messwerte können Ihnen auch bei der Planung zukünftiger Bereitstellungen helfen. Klicken Sie oben auf der Seite „Dashboard zur Leistungsüberwachung“ auf Leistung für alle Google Cloud ansehen, um globale Messwerte anzuzeigen.

Mit diesen Leistungsüberwachungsfunktionen können Sie zwischen Problemen in Ihrer Anwendung und Problemen im zugrunde liegenden Google Cloud-Netzwerk unterscheiden. Sie können auch Probleme mit der bisherigen Leistung des Netzwerks beheben.

Dashboards zur Leistungsüberwachung exportieren auch Daten nach Cloud Monitoring. Mit Monitoring können Sie die Daten abfragen und auf zusätzliche Informationen zugreifen. Weitere Informationen finden Sie unter Monitoring-Messwerte ansehen.

Google Cloud-Leistungsansicht

In dieser Ansicht zeigen Dashboards zur Leistungsüberwachung die allgemeinen Google Cloud-Messwerte für jedes mögliche Google Cloud-Zonenpaar an. Sie zeigt den aktuellen Status des Google Cloud-Netzwerks an und ermöglicht einen Vergleich zwischen der Leistung in Google Cloud insgesamt und der Leistung, die in Ihren Projekten beobachtet wird.

Die Google Cloud-Leistungsansicht zeigt Zeitachsendaten von bis zu 50 Zonenpaaren für das ausgewählte Zeitfenster an, das standardmäßig eine Stunde beträgt.

Sie können die Netzwerkleistung für jedes Google Cloud-Zonenpaar ansehen, auch wenn Ihr Projekt nicht in diesen Zonen bereitgestellt wird. Sie können die Leistung sowohl auf Regionsebene als auch auf Zonenebene ansehen. Ein zusammenfassendes Zeitachsendiagramm zeigt bis zu 50 Zonenpaare mit dem höchsten aggregierten VM-zu-VM-Paketverlust oder der höchsten Latenz in der gesamten Google Cloud.

Wenn Sie alle Google Cloud-Leistungsmesswerte in Dashboards zur Leistungsüberwachung Ihres Projekts ansehen möchten, halten Sie den Mauszeiger über die jeweiligen Zonenpaare. Wenn Sie die Leistung des gesamten Google Cloud-Netzwerks in Dashboards zur Leistungsüberwachung ansehen möchten, klicken Sie auf Leistung für Google Cloud insgesamt ansehen.

Messwerte

Das Dashboard zur Leistungsüberwachung bietet zwei Arten von Messwerten: Paketverlustmesswerte und Latenzmesswerte (Umlaufzeit bzw. RTT). Sie benötigen eine ausreichende Anzahl von VMs im Projekt, um Paketverlustmesswerte für Ihr Projekt abzurufen. Sie benötigen eine ausreichende Menge an Traffic, um Latenzmesswerte zu erhalten. Ansonsten ist für das Dashboard zur Leistungsüberwachung keine Einrichtung erforderlich.

In den folgenden Abschnitten werden beide Messwerte ausführlicher beschrieben.

Paketverlust

Die Messwerte für Paketverluste zeigen die Ergebnisse der aktiven Prüfung zwischen folgenden Elementen:

  • VMs in einem einzelnen VPC-Netzwerk

  • VMs in Peering-VPC-Netzwerken, wenn sich ein oder beide Netzwerke in Ihrem Projekt befinden. Wenn sich die Peering-Netzwerke in verschiedenen Projekten befinden, ist der Paketverlust im Zielprojekt sichtbar.

  • VMs in einem freigegebenen VPC-Netzwerk, die von Ihrem Projekt verwendet werden. Der Paketverlust zwischen zwei Projekten, die ein freigegebenes VPC-Netzwerk verwenden, ist im Zieldienstprojekt sichtbar.

Angenommen, Projekt A enthält zwei VPC-Netzwerke: Netzwerk A mit VMs nur in Zone A und Netzwerk M mit VMs nur in Zone M. Wenn diese beiden Netzwerke über Peering miteinander verbunden sind, werden in Dashboards zur Leistungsüberwachung von Projekt A Paketverlustdaten für das A/M-Zonenpaar angezeigt. Wenn die Netzwerke nicht per Peering verbunden sind, werden in Dashboards zur Leistungsüberwachung keine Paketverlustdaten für dieses Zonenpaar angezeigt.

Angenommen, beide Netzwerke befinden sich nicht im selben Projekt. Das heißt, Netzwerk A gehört zu Projekt A und Netzwerk M gehört zu Projekt M. Bei einem Peering der Netzwerke zeigt das Dashboard zur Leistungsüberwachung des Projekts M Paketverlustdaten in Fällen an, in denen Zone M die Zielzone ist. Umgekehrt gilt: Wenn Zone A die Zielzone ist, sind die Paketverlustdaten nur für Projekt A sichtbar. Wenn die Netzwerke nicht per Peering verbunden sind, werden im Dashboard zur Leistungsüberwachung des Projekts keine Daten zum Paketverlust für das Zonenpaar angezeigt.

Die bei allen Prüfungen erhobenen Daten werden im Dashboard zur Leistungsüberwachung zusammengefasst. Das Dashboard zur Leistungsüberwachung erlaubt es Ihnen also nicht, Daten zum produktinternen Paketverlust im Vergleich zu anderen Typen zu isolieren (z. B. Paketverluste im Zusammenhang mit einem Peering-VPC-Netzwerk in einem anderen Projekt). Sie können jedoch Monitoring verwenden, um die Ergebnisse detaillierter aufzuschlüsseln. Weitere Informationen finden Sie unter Monitoring-Messwerte aufrufen.

Das Dashboard zur Leistungsüberwachung sendet keine Prüfungen über Cloud VPN-Verbindungen.

Methoden

Im Dashboard zur Leistungsüberwachung werden Worker auf den physischen Hosts ausgeführt, auf denen sich Ihre VMs befinden. Diese Worker empfangen Prüfpakete, die im selben Netzwerk wie Ihr Traffic ausgeführt werden, und fügen sie ein. Da die Worker auf den physischen Hosts und nicht auf den VMs ausgeführt werden, verbrauchen diese Worker keine VM-Ressourcen und der Traffic ist auf Ihren VMs nicht sichtbar.

Die Prüfungen decken das gesamte Mesh-Netzwerk der VMs ab, die miteinander kommunizieren können. Dies entspricht nicht unbedingt Ihrem Trafficmuster. Daher sind im Dashboard zur Leistungsüberwachung möglicherweise Anzeichen für Paketverluste zu sehen, in Ihrer Anwendung gibt es jedoch keine Hinweise auf Paketverluste.

Wir versuchen, bei allen geprüften VMs auf die VM zuzugreifen. Dazu verwenden wird ihre interne IP-Adresse und gegebenenfalls eine externe IP-Adresse. Die Prüfungen bleiben auf Google Cloud. Durch die Verwendung externer IP-Adressen kann das Dashboard zur Leistungsüberwachung jedoch einen Teil des Pfads abdecken, der von externem Traffic verwendet werden würde, beispielsweise von Traffic aus dem Internet.

Der Paketverlust für interne IP-Adressen wird mithilfe von UDP-Paketen gemessen. Der Paketverlust für externe IP-Adressen wird mithilfe von TCP-Paketen gemessen.

Messwertverfügbarkeit und Konfidenzgrade

Das Dashboard zur Leistungsüberwachung prüft einen Teil aller VM-VM-Paare im Netzwerk. Die erfassten Daten werden dann verwendet, um den Paketverlust abzuschätzen, der bei Ihnen möglicherweise auftritt. Die Konfidenz von Google bezüglich der Daten hängt von der Prüfungsrate ab und diese Prüfungsrate hängt von der Anzahl der VMs in jeder Zone sowie von der Anzahl der Zonen ab, in denen Sie VMs bereitgestellt haben. Wenn Sie beispielsweise zehn VMs in zwei Zonen haben, ist die Konfidenz höher als bei zehn VMs in zehn Zonen.

Alle VMs, auch die von Google Kubernetes Engine (GKE) erstellten, werden auf die Gesamtzahl der VMs angerechnet.

In der folgenden Tabelle werden die unterschiedlichen Konfidenzgrade beschrieben. Niedrigere Konfidenzgrade werden in der Heatmap mit einem Sternchen oder N/A gekennzeichnet.

Level Erforderliche Anzahl von VMs in den einzelnen Zonen Das Dashboard zur Leistungsüberwachung auf der Heatmap
95 % Konfidenz 10 VMs x die Anzahl der Zonen im Projekt. Wenn es beispielsweise 12 Zonen in Ihrem Projekt gibt, müssen in jeder Zone 120 VMs vorhanden sein. Ein Messwert ohne zusätzliche Aussage
90 % Konfidenz 2,5 VMs x die Anzahl der Zonen im Projekt. Wenn es beispielsweise 12 Zonen in Ihrem Projekt gibt, müssen in jeder Zone 30 VMs vorhanden sein. Ein Messwert ohne zusätzliche Aussage
Geringe Zuverlässigkeit Ein Messwert mit einem Sternchen
Nicht genügend Prüfungen, um aussagekräftige Daten zu erhalten N/A

Die Google Cloud-Paketverlustmesswerte sind immer verfügbar. Die Messwerte für die Paketverluste pro Projekt sind nur verfügbar, wenn für das Zonenpaar mehr als 200 Prüfungen pro Minute durchgeführt wurden. Ein Sternchen (*) wird angezeigt, wenn 200 bis 400 Prüfungen pro Minute durchgeführt werden.

Latenz

Latenzmesswerte werden anhand des tatsächlichen Kundentraffics zwischen folgenden Elementen gemessen:

  • VMs in einem einzelnen VPC-Netzwerk

  • VMs zwischen Peering-VPC-Netzwerken, wenn sich die Netzwerke im selben Projekt befinden.

Darüber hinaus zeigt das Dashboard zur Leistungsüberwachung für ein Dienstprojekt in einem freigegebenen VPC-Netzwerk nur Daten für die Zonen innerhalb des Dienstprojekts. Angenommen, eine VM in Zone A und das Dienstprojekt A verwenden das Hostprojekt für die Kommunikation mit einer VM in Zone B und dem Dienstprojekt B. Messwerte zu diesem Traffic sind weder für ein Dienstprojekt noch für das Hostprojekt verfügbar.

In Dashboards zur Leistungsüberwachung werden für Folgendes keine Latenzdaten angezeigt:

  • Traffic zwischen Peering-VPC-Netzwerken, wenn sich ein VPC-Netzwerk in einem anderen Projekt befindet.

  • Traffic, der über Cloud VPN-Verbindungen gesendet wird.

Methoden

Die Latenz wird mithilfe von TCP-Paketen gemessen.

Basierend auf einer Stichprobe des tatsächlichen Traffics wird die Latenz als der Zeitraum zwischen dem Senden einer TCP-Sequenznummer (SQE) und dem Empfang einer entsprechenden ACK (ESP) berechnet, die die Netzwerk-RTT- und TCP-Stack-Verzögerung enthält. In der UI wird die Latenz als Medianwert aller relevanten Messungen dargestellt.

Der Latenzmesswert basiert auf derselben Datenquelle und Stichprobenmethode wie VPC-Flusslogs.

Messwertverfügbarkeit

Der Latenzmesswert von Google Cloud ist immer verfügbar. Der Messwert „Latenz pro Projekt“ ist nur verfügbar, wenn TCP-Traffic bei etwa 1.000 Paketen pro Minute oder mehr liegt.

Übersichtstabelle der Messwerte

In der folgenden Tabelle sind die Prüfmethoden und -protokolle zusammengefasst, die zum Melden von Paketverlusten und Latenzmesswerten verwendet werden.

Paketverlust Latenz
Prüfungsmethode Aktive Prüfung (synthetischer VM-Traffic) Passive Prüfung (tatsächlicher VM-Traffic)
Protokoll UDP (interne IP-Adresse), TCP (externe IP-Adresse) TCP (interne/externe IP-Adressen)

Obwohl in der vorherigen Tabelle auf externe IP-Adressen verwiesen wird, zeigen Dashboards zur Leistungsüberwachung nur Daten zum internen Traffic an. Mit Cloud Monitoring können Sie aggregierte Daten zum Traffic aufrufen, den Ihre VMs aus externen Quellen empfangen.

Berechtigungen

Für den Zugriff auf Daten aus Dashboards zur Leistungsüberwachung, sowohl über die Cloud Console als auch über Monitoring, benötigen Sie die Berechtigung monitoring.timeSeries.list. Diese Berechtigung ist in den in der folgenden Tabelle aufgeführten Monitoring-Rollen enthalten.

Rollenname Rollen-ID
Monitoring-Betrachter roles/monitoring.viewer
Monitoring-Editor roles/monitoring.editor
Monitoring-Administrator roles/monitoring.admin

Informationen zu anderen Rollen mit der Berechtigung monitoring.timeSeries.list finden Sie unter Informationen zu Rollen.

Datenvisualisierung beim Ansehen von Verlaufsdaten

Wenn Sie sich Daten für einen Zeitraum von einem oder mehreren Tagen ansehen, werden im Diagramm zusätzliche Daten in Form einer helleren Farbe (ein Feld) um die Primärdaten angezeigt. Die hellere Farbe um die Linie zeigt den Wertebereich vom niedrigsten zum höchsten Wert an, die zum Zeichnen der primären Linie aggregiert wurden.

Aggregierte Verlaufsdaten.
Aggregierte Verlaufsdaten (zum Vergrößern anklicken)

Nächste Schritte