Dashboards zur Leistungsüberwachung – Übersicht

Über Dashboards zur Leistungsüberwachung erhalten Sie Einblick in die Leistung des gesamten Google Cloud-Netzwerks und die Leistung Ihrer Projektressourcen.

Mit diesen Leistungsüberwachungsfunktionen können Sie zwischen Problemen in Ihrer Anwendung und Problemen im zugrunde liegenden Google Cloud-Netzwerk unterscheiden. Sie können auch bisherige Probleme mit der Netzwerkleistung untersuchen.

Dashboards zur Leistungsüberwachung exportieren auch Daten nach Cloud Monitoring. Mit Monitoring können Sie die Daten abfragen und auf zusätzliche Informationen zugreifen. Weitere Informationen finden Sie unter Messwertreferenz für Dashboards zur Leistungsüberwachung.

Ansicht der Projektleistung

In der Projektleistungsansicht werden im Dashboard zur Leistungsüberwachung Paketverlust- oder Latenzmesswerte nur für Zonen angezeigt, in denen Sie VM-Instanzen projektieren. Beispiel: VM-zu-VM-Traffic und VM-zu-Internet-Traffic. Sie können bis zu fünf Regionen auswählen, in denen die Arbeitslasten bereitgestellt werden. Im Dashboard können Sie Folgendes sehen und verstehen:

  • Zusammenfassung des Paketverlusts
  • Durchschnittlicher Paketverlust zwischen Regionspaaren der ausgewählten Regionen
  • Durchschnittlicher Paketverlust zwischen Zonenpaaren der ausgewählten Regionen
  • Latenzübersicht
  • Medianwert der Latenz zwischen Regionspaaren der ausgewählten Regionen
  • Medianwert der Latenz zwischen Zonenpaaren der ausgewählten Regionen

Traffic zwischen VM-Instanzen

Dashboards zur Leistungsüberwachung zeigen Paketverlust- und Latenzmesswerte (in Übersichtsdiagrammen und Heatmaps) für Zonen an, in denen Compute Engine-VM-Instanzen vorhanden sind. Sie liefert aktuelle Daten und Messwerte für die letzten sechs Wochen. Ihr Projekt hat beispielsweise ein VPC-Netzwerk (Virtual Private Cloud) mit VMs in den Zonen A und B. In einem solchen Fall bietet das Dashboards zur Leistungsüberwachung Paketverlust- und Latenzmesswerte für Ihr Projekt zwischen diesen beiden Zonen.

Sie können die aggregierten Latenzmesswerte auch aus einer Stichprobe des tatsächlichen VM-zu-VM-Traffics in einer tabellarischen Ansicht abhängig vom ausgewählten Zeitraum aufrufen. In der Tabelle mit den Latenzdetails sind die VMs und die entsprechenden Latenzdetails aufgeführt.

Traffic zwischen Google Cloud und Internetstandorten

Das Dashboards zur Leistungsüberwachung zeigt Latenzmesswerte für Regionen, in denen Sie VM-Instanzen von Compute Engine haben, und die Internetstandorte der Endgeräte, die mit den VMs kommunizieren. Sie bietet die aktuellen Latenzmesswerte und Verlaufsdaten für sechs Wochen. Ihr Projekt hat beispielsweise ein Virtual Private Cloud-Netzwerk mit VMs in Region A, die Traffic von Clients in den Städten X und Y empfangen. In einem solchen Fall stellt das Dashboards zur Leistungsüberwachung Latenzmesswerte für Ihr Projekt zwischen Region A und den Städten X und Y zur Verfügung.

Klicken Sie zum Ansehen der Projektmesswerte oben auf der Seite "Dashboards zur Leistungsüberwachung" auf Projektleistung ansehen. Weitere Beispiele und Details zu den gemessenen Messwerten finden Sie unter Messwerte.

Google Cloud-Leistungsansicht

In der Google Cloud-Leistungsansicht werden im Dashboards zur Leistungsüberwachung Zonen-zu-Zonen-Paketverlust- und Latenzmesswerte für alle Google Cloud-Produkte angezeigt. Beispiel: VM-zu-VM-Traffic und Traffic von Google Cloud zum Internet. Das Dashboard zeigt den Status des Google Cloud-Netzwerks an und ermöglicht Ihnen, die Leistung in Google Cloud mit der in Ihren Projekten beobachteten Leistung zu vergleichen. Sie können bis zu fünf Google Cloud-Regionen auswählen, um Folgendes zu sehen und zu verstehen:

  • Zusammenfassung des Paketverlusts. In dieser Ansicht können bis zu 50 Zonenpaare mit VM-zu-VM-Paketverlust in Google Cloud insgesamt angezeigt werden.
  • Durchschnittlicher Paketverlust zwischen Zonenpaaren.
  • Latenzzusammenfassung. In dieser Ansicht können bis zu 50 Zonenpaare mit VM-zu-VM-Umlaufzeit (Round Trip Time, RTT) in Google Cloud insgesamt angezeigt werden.
  • Medianwert für die Latenz zwischen Zonenpaaren.

Traffic zwischen VM-Instanzen

Das Dashboards zur Leistungsüberwachung zeigt die Paketverlust- und Latenzmesswerte in Google Cloud insgesamt. Diese Messwerte können Ihnen dabei helfen, zu verstehen, ob Probleme, die im projektspezifischen Dashboard angezeigt werden, nur bei Ihrem Projekt auftreten.

Die Google Cloud-Leistungsansicht zeigt Zeitachsendaten von bis zu 50 Zonenpaaren für das ausgewählte Zeitfenster an, das standardmäßig eine Stunde beträgt.

Sie können die Netzwerkleistung für jedes Google Cloud-Zonenpaar ansehen, auch wenn Ihr Projekt nicht in diesen Zonen bereitgestellt ist. Sie können die Leistung sowohl auf Regions- als auch auf Zonenebene aufrufen. Ein zusammenfassendes Zeitachsendiagramm zeigt bis zu 50 Zonenpaare mit dem höchsten aggregierten VM-zu-VM-Paketverlust oder der höchsten Latenz in der gesamten Google Cloud.

Traffic zwischen Google Cloud und Internetstandorten

Dashboards zur Leistungsüberwachung zeigt Latenzmesswerte zwischen VMs in allen Google Cloud-Regionen und Internetendpunkten. Sie können den Traffic auf Stadt-, Regions- und Länderebene aggregieren. Sie können die Latenzmesswerte für bestimmte Regions-Standortpaare aufrufen, wenn genügend Google Cloud-Traffic für dieses Paar vorhanden ist.

Mit diesen Messwerte können Sie beurteilen, ob Probleme im Dashboard des jeweiligen Projekts nur bei Ihrem Projekt auftreten. Die globalen Messwerte können Ihnen auch bei der Planung zukünftiger Bereitstellungen helfen.

Klicken Sie zum Anzeigen der Google Cloud-Leistungsmesswerte oben auf der Seite "Dashboard zur Leistungsüberwachung" auf Leistung für die gesamte Google Cloud anzeigen. Wenn Sie die Google Cloud-Leistungsmesswerte aus der Ansicht der Projektleistung abrufen möchten, halten Sie den Mauszeiger über die jeweiligen Zonenpaare. Weitere Beispiele und Details zu den gemessenen Messwerten finden Sie unter Messwerte.

Messwerte

Das Dashboard zur Leistungsüberwachung bietet zwei Arten von Messwerten: Paketverlustmesswerte und Latenzmesswerte (Umlaufzeit bzw. RTT). Um Paketverlustmesswerte für Ihr Projekt abzurufen, benötigen Sie eine ausreichende Anzahl von VMs im Projekt. Sie benötigen eine ausreichende Menge an Traffic, um Latenzmesswerte zu erhalten. Ansonsten ist für das Dashboard zur Leistungsüberwachung keine Einrichtung erforderlich.

In den folgenden Abschnitten werden beide Messwerte ausführlicher beschrieben.

Paketverlust

Die Messwerte für Paketverluste zeigen die Ergebnisse der aktiven Prüfung zwischen folgenden Elementen:

  • VMs in einem einzelnen VPC-Netzwerk

  • VMs in Peering-VPC-Netzwerken, wenn sich ein oder beide Netzwerke in Ihrem Projekt befinden. Wenn sich die Peering-Netzwerke in verschiedenen Projekten befinden, ist der Paketverlust im Zielprojekt sichtbar.

  • VMs in einem freigegebenen VPC-Netzwerk, die von Ihrem Projekt verwendet werden. Der Paketverlust zwischen zwei Projekten, die ein freigegebenes VPC-Netzwerk verwenden, ist im Zieldienstprojekt sichtbar.

Angenommen, Projekt A enthält zwei VPC-Netzwerke: Netzwerk A mit VMs nur in Zone A und Netzwerk M mit VMs nur in Zone M. Wenn diese beiden Netzwerke über Peering verbunden sind, zeigt das Dashboards zur Leistungsüberwachung von Projekt A die Paketverlustdaten für das A/M-Zonenpaar an. Wenn die Netzwerke nicht über Peering verbunden sind, wird Dashboards zur Leistungsüberwachung nicht der Paketverlustmesswert für dieses Zonenpaar angezeigt.

Angenommen, beide Netzwerke befinden sich nicht im selben Projekt. Das heißt, Netzwerk A gehört zu Projekt A und Netzwerk M gehört zu Projekt M. Bei einem Peering der Netzwerke zeigt das Dashboard zur Leistungsüberwachung des Projekts M Paketverlustdaten in Fällen an, in denen Zone M die Zielzone ist. Umgekehrt gilt: Wenn Zone A die Zielzone ist, sind die Paketverlustdaten nur für Projekt A sichtbar. Wenn die Netzwerke nicht per Peering verbunden sind, werden im Dashboard zur Leistungsüberwachung des Projekts keine Daten zum Paketverlust für das Zonenpaar angezeigt.

Die bei allen Prüfungen erfassten Daten werden im Dashboards zur Leistungsüberwachung zusammengefasst. Das Dashboard zur Leistungsüberwachung erlaubt es Ihnen also nicht, Daten zum produktinternen Paketverlust im Vergleich zu anderen Typen zu isolieren (z. B. Paketverluste im Zusammenhang mit einem Peering-VPC-Netzwerk in einem anderen Projekt). Sie können jedoch Monitoring verwenden, um die Ergebnisse detaillierter aufzuschlüsseln. Weitere Informationen finden Sie unter Messwertreferenz für Dashboards zur Leistungsüberwachung.

Das Dashboard zur Leistungsüberwachung sendet keine Prüfungen über Cloud VPN-Verbindungen.

Methoden

Im Dashboard zur Leistungsüberwachung werden Worker auf den physischen Hosts ausgeführt, auf denen sich Ihre VMs befinden. Diese Worker empfangen Prüfpakete, die im selben Netzwerk wie Ihr Traffic ausgeführt werden, und fügen sie ein. Da die Worker auf den physischen Hosts und nicht auf Ihren VMs ausgeführt werden, verbrauchen sie keine VM-Ressourcen und der Traffic ist auf Ihren VMs nicht sichtbar.

Die Prüfungen decken das gesamte Mesh-Netzwerk der VMs ab, die miteinander kommunizieren können. Dies entspricht nicht unbedingt Ihrem Trafficmuster. Daher sind im Dashboard zur Leistungsüberwachung möglicherweise Anzeichen für Paketverluste zu sehen, in Ihrer Anwendung gibt es jedoch keine Hinweise auf Paketverluste.

Wir versuchen, bei allen geprüften VMs auf die VM zuzugreifen. Dazu verwenden wird ihre interne IP-Adresse und gegebenenfalls eine externe IP-Adresse. Die Prüfungen verlassen Google Cloud nicht, aber mithilfe externer IP-Adressen kann das Dashboards zur Leistungsüberwachung einen Teil des Pfads abdecken, der von externem Traffic verwendet wird, z. B. Traffic aus dem Internet.

Der Paketverlust für interne IP-Adressen wird mithilfe von UDP-Paketen gemessen. Der Paketverlust für externe IP-Adressen wird mithilfe von TCP-Paketen gemessen.

Messwertverfügbarkeit und Konfidenzgrade

Das Dashboard zur Leistungsüberwachung prüft einen Teil aller VM-VM-Paare im Netzwerk. Die erfassten Daten werden dann verwendet, um den Paketverlust abzuschätzen, der bei Ihnen möglicherweise auftritt. Die Konfidenz von Google bezüglich der Daten hängt von der Prüfungsrate ab und diese Prüfungsrate hängt von der Anzahl der VMs in jeder Zone sowie von der Anzahl der Zonen ab, in denen Sie VMs bereitgestellt haben. Wenn Sie beispielsweise zehn VMs in zwei Zonen haben, ist die Konfidenz höher als bei zehn VMs in zehn Zonen.

Alle VMs, auch die von Google Kubernetes Engine (GKE) erstellten, werden auf die Gesamtzahl der VMs angerechnet.

In der folgenden Tabelle werden die unterschiedlichen Konfidenzgrade beschrieben. Niedrigere Konfidenzgrade werden in der Heatmap mit einem Sternchen (*) oder N/A gekennzeichnet.

Stufe Erforderliche Anzahl von VMs in den einzelnen Zonen Das Dashboard zur Leistungsüberwachung auf der Heatmap
95 % Konfidenz 10 VMs x die Anzahl der Zonen im Projekt. Wenn es beispielsweise 12 Zonen in Ihrem Projekt gibt, müssen in jeder Zone 120 VMs vorhanden sein. Ein Messwert ohne zusätzliche Aussage
90 % Konfidenz 2,5 VMs x die Anzahl der Zonen im Projekt. Wenn es beispielsweise 12 Zonen in Ihrem Projekt gibt, müssen in jeder Zone 30 VMs vorhanden sein. Ein Messwert ohne zusätzliche Aussage
Geringe Zuverlässigkeit Ein Messwert mit einem Sternchen
Nicht genügend Prüfungen, um aussagekräftige Daten zu erhalten N/A

Die Google Cloud-Paketverlustmesswerte sind immer verfügbar. Ein Sternchen (*) wird angezeigt, wenn weniger als 400 Prüfungen pro Minute vorhanden sind.

Projektspezifische Latenz

Latenzmesswerte werden anhand des Kundentraffics zwischen folgenden Elementen gemessen:

  • VMs in einem einzelnen VPC-Netzwerk
  • VMs zwischen Peering-VPC-Netzwerken, wenn sich die Netzwerke im selben Projekt befinden
  • VMs und Internetendpunkte

Darüber hinaus zeigt das Dashboard zur Leistungsüberwachung für ein Dienstprojekt in einem freigegebenen VPC-Netzwerk nur Daten für die Zonen innerhalb des Dienstprojekts. Angenommen, eine VM in Zone A und das Dienstprojekt A verwenden das Hostprojekt für die Kommunikation mit einer VM in Zone B und dem Dienstprojekt B. Messwerte zu diesem Traffic sind weder für ein Dienstprojekt noch für das Hostprojekt verfügbar.

Google Cloud-Latenz

Latenzmesswerte werden anhand des tatsächlichen Kundentraffics zwischen folgenden Elementen gemessen:

  • VMs in einem einzelnen VPC-Netzwerk
  • VMs zwischen Peering-VPC-Netzwerken
  • VMs und Internetendpunkte

Methoden für die Projekt- und Google Cloud-Latenz

Die Latenz wird mithilfe von TCP-Paketen gemessen.

Basierend auf einer Stichprobe des tatsächlichen Traffics wird die Latenz als der Zeitraum zwischen dem Senden einer TCP-Sequenznummer (SQE) und dem Empfang einer entsprechenden ACK (ESP) berechnet, die die Netzwerk-RTT- und TCP-Stack-Verzögerung enthält. Im Dashboard wird die Latenz als Medianwert aller relevanten Messungen angezeigt.

Der Latenzmesswert basiert auf derselben Datenquelle und Stichprobenmethode wie VPC-Flusslogs.

Die projektspezifische Latenz basiert auf Stichproben aus Ihrem Projekt. Die Google Cloud-Latenz basiert auf Stichproben aus der gesamten Google Cloud-Umgebung.

Die globalen Latenzmesswerte werden aus passiven Stichproben von TCP-Traffic-Headern abgeleitet und nicht durch aktive Prüfungen von Google Cloud zu Internetendpunkten.

Anomalien mit Latenzmesswerten

Beachten Sie die folgenden Anomalien bei den Latenzmesswerten:

  • In Umgebungen mit niedrigen Datenraten verwendet Network Intelligence Center 60-Sekunden-Prüfungen für Latenzmesswerte. Daher können RTT-Messwerte, die auf Paketstichproben basieren, möglicherweise falsche hohe Latenzwerte melden, wenn TCP-basierte Dienste eine verzögerte Antwort auf Anwendungsebene zurückgeben. Sie können die falsch hohen RTT-Werte in der Regel erkennen, indem Sie prüfen, ob sie mit Verzögerungen auf Anwendungsebene zusammenhängen.

    Obwohl der TCP-basierte Dienst schnell mit einer ACK antwortet, verpassen die Stichproben die ACK und zählen eine spätere Datenantwort als schließende ACK für eine viel frühere SEND, was die Gesamt-RTT-Messung verzerrt. In diesen Fällen können Sie die RTT-Messwerte ignorieren.

  • Manchmal stimmen die projektspezifischen Latenzdaten nicht mit den globalen Latenzdaten überein. Solche Abstimmungsprobleme können auftreten, wenn das globale Dataset auch andere Netzwerkpfade mit erheblich unterschiedlichen Latenzen in Bezug auf den vom jeweiligen Projekt verwendeten Netzwerkpfad enthält.

Messwertverfügbarkeit

Der Latenzmesswert von Google Cloud ist immer verfügbar. Der Latenzmesswert pro Projekt ist nur verfügbar, wenn der TCP-Traffic etwa 1.000 Pakete pro Minute oder höher umfasst.

Übersichtstabelle der Messwerte

In der folgenden Tabelle sind die Prüfmethoden und -protokolle zusammengefasst, die zum Melden von Paketverlusten und Latenzmesswerten verwendet werden.

Paketverlust Latenz
Prüfungsmethode Aktive Prüfung (synthetischer VM-Traffic) Passive Prüfung (tatsächlicher VM-Traffic)
Protokoll UDP (interne IP-Adresse), TCP (externe IP-Adresse) TCP (interne/externe IP-Adressen)

Latenzansichten

Die Latenzdetails für den Traffictyp Internet zu Google Cloud sind in drei Ansichten verfügbar: Tabellenansicht, Kartenansicht und Zeitachsenansicht.

Tabellenansicht

Die Ansicht Tabelle zeigt die Median-RTT zwischen den ausgewählten geografischen Gebieten und den Regionen, die VM-Instanzen in Ihrem Projekt enthalten. Die Tabelle enthält die folgenden Details:

  • Land:Der Name des Landes.
  • Städte:Die Anzahl der Städte. Sie können die Latenzdetails der einzelnen Städte in der Grafik mit den Länderdetails ansehen.
  • Zielregionen:Die Anzahl der Zielregionen mit Traffic für Nutzer aus einem bestimmten Land.
  • Medianlatenz:Die Median-RTT zwischen dem Land und den Regionen in Millisekunden.

Kartenansicht

In der Kartenansicht werden die geografischen Standorte (Großräume oder Städte) und Google Cloud-Regionen angezeigt.

  • Sie können sich die Medianlatenz bestimmter Standorte und Google Cloud-Regionen ansehen.
  • Sie können eine Google Cloud-Region auswählen und die Standorte mit Traffic in der ausgewählten Region ansehen.
  • Sie können standortspezifische Details in einer Latenzgrafik in der Seitenleiste sehen.
  • Sie können mithilfe des Suchfelds auf der Karte nach Orten suchen.
  • Standorte werden in verschiedenen Blautönen farblich abgestuft, um die Bereiche der Medianlatenz auf der Karte anzugeben. In der folgenden Abbildung kann ein Kreis, der eine bestimmte Stadt auf einer Weltkarte darstellt, einen Blauton haben. Je dunkler der Blauton, desto größer ist die Latenz dieser Stadt von einer bestimmten Google Cloud-Region aus.

    Bereiche der Medianlatenz auf der Karte.
    Bereiche der Medianlatenz auf der Karte (zum Vergrößern klicken).

Zeitachsenansicht

Die Zeitachse zeigt die Median-RTT zwischen den ausgewählten geografischen Gebieten und Google Cloud-Regionen. Sie liefert die aktuellen Latenzmesswerte und Verlaufsdaten aus sechs Wochen. Mit den Filtern können Sie den Traffic auf Stadt-, Regions- und Länderebene weiter aggregieren. Sie können die Latenzmesswerte für bestimmte regions-geografische Standortpaare nur dann ansehen, wenn für dieses Paar genügend Google Cloud-Traffic vorhanden ist.

Berechtigungen

Für den Zugriff auf Daten aus Dashboards zur Leistungsüberwachung, sowohl über die Google Cloud Console als auch über Monitoring, benötigen Sie die Berechtigung monitoring.timeSeries.list. Diese Berechtigung ist in den in der folgenden Tabelle aufgeführten Monitoring-Rollen enthalten.

Rollenname Rollen-ID
Monitoring-Betrachter roles/monitoring.viewer
Monitoring-Editor roles/monitoring.editor
Monitoring-Administrator roles/monitoring.admin

Informationen zu anderen Rollen mit der Berechtigung monitoring.timeSeries.list finden Sie unter Informationen zu Rollen.

Projektbereich ändern

Wenn Sie einen vorhandenen Messwertbereich nutzen und mehrere Google Cloud-Projekte in einer einzigen Ansicht überwachen möchten, wählen Sie in der Projektauswahl der Google Cloud Console oder über die Schaltfläche Bereich ändern das den Umfang festlegende Projekt aus. Mit diesen Optionen können Sie auch ein einzelnes Monitoringprojekt auswählen. Weitere Informationen finden Sie unter Messwertreferenz für Dashboards zur Leistungsüberwachung.

Sie können Benachrichtigungen bei hohem Paketverlust basierend auf vordefinierten Bedingungen erstellen. Die Benachrichtigungsrichtlinie für Paketverlust wird ausgelöst, wenn der Paketverlust 5 Minuten lang für ein Regionspaar 5% überschreitet.

Durch Benachrichtigungen werden Sie rechtzeitig über Probleme in Ihren Cloud-Anwendungen informiert und können sie dann umgehend beheben. Eine Benachrichtigungsrichtlinie beschreibt die Umstände, unter denen Sie benachrichtigt werden möchten, sowie die Art der Benachrichtigung. Weitere Informationen zum Erstellen und Verwalten von Benachrichtigungsrichtlinien finden Sie unter Einführung in Benachrichtigungen.

Nächste Schritte