Fehler bei der Netzwerkverbindung beheben

In diesem Anwendungsfall sind Sie der Administrator eines Netzwerks, das mehrere Anwendungen mit Load-Balancing umfasst. Sie wurden über ein Latenzproblem informiert und Ihnen wurde mitgeteilt, dass die mobile Anwendung Ihres Unternehmens zeitweise langsam ist und eine Zeitüberschreitung auftritt. Sie wissen, dass eine Reihe verschiedener Nutzer betroffen sind und dass in letzter Zeit keine Anwendungsbereitstellungen stattgefunden haben. Das Problem hängt wahrscheinlich mit einer Änderung der Umgebung und nicht der Anwendung zusammen.

Der folgende Anwendungsfall zeigt, wie Sie mithilfe von Netzwerktopologie Probleme in Ihrer Bereitstellung schnell beheben und untersuchen können.

Topologie – Details

Die Bereitstellung umfasst drei Google Cloud-Regionen (us-central1, europe-west1 und asia-east1). Alle externen Clientanfragen werden von einem einzelnen externen HTTP(S)-Load-Balancer verarbeitet, der in jeder der drei Regionen mehrere Back-Ends hat. Clientanfragen aus einer von drei Geschäftsregionen (Amerika, EMEA und APAC) werden von Anwendungsinstanzen in der nächstgelegenen Google Cloud-Region verarbeitet.

Das folgende Diagramm zeigt die allgemeine Hierarchie für die Bereitstellung:

Netzwerklatenz

Nehmen Sie in diesem Szenario an, dass Sie einen Load-Balancer mit dem Namen shopping-site-lb haben. Sie prüfen die Latenz zwischen externen Clients und dem Load-Balancer, um festzustellen, ob sich die Latenz zwischen ihnen geändert hat. Sie sehen, dass dies der Fall ist, und beschließen, die Back-Ends des Load-Balancers weiter zu untersuchen.

  1. Sie filtern das Diagramm so, dass nur der Traffic für Ihren externen Load-Balancer shopping-site-lb angezeigt wird.

    Nachdem Sie den Filter angewendet haben, zeigt Netzwerktopologie nur die Verbindungen an, die sich auf den Load-Balancer beziehen, wie im folgenden Beispiel gezeigt.

  2. Beginnend mit den externen Clients in Amerika klicken Sie auf die Trafficmesswerte zwischen der Geschäftsregion Amerika und dem Load-Balancer.

    Netzwerktopologie zeigt Diagramme im Detailbereich an. Die Informationen umfassen eingehenden und ausgehenden Traffic zwischen der ausgewählten und der verbundenen Entität. Beispielsweise liefert Netzwerktopologie die neuesten Werte für Abfragen pro Sekunde (Queries per Second, QPS) und die HTTP-Anfragelatenz.

    Im Diagramm der Anfragelatenz sehen Sie Werte für das 50., 95. und 99. Perzentil. In diesem Beispiel wird davon ausgegangen, dass alle Latenzwerte höher sind als erwartet.

  3. Oben im Detailbereich erweitern Sie die Zeitachsendiagramme auf sechs Stunden. Dafür klicken Sie auf 6h.

    1Die Abbildung dient als Referenz. Die Daten spiegeln nicht den Anwendungsfall wider.

    Sie sehen einen signifikanten Sprung, der vor etwa zwei Stunden aufgetreten ist. Dies ist ungefähr der Zeitpunkt, zu dem die ersten Probleme gemeldet wurden. Sie sind sicher, dass das Problem mit einer erhöhten Latenz des Load-Balancers zusammenhängt.

  4. Einen groben Überblick über das Problem erhalten Sie auf der Seite Load-Balancing in der Google Cloud Console. Sie werden schließlich feststellen, dass eine Instanz im Back-End-Dienst des Load-Balancers länger als normal zum Antworten brauchte. Sie nehmen diese Instanz außer Betrieb, wodurch das Problem behoben wird.

Weitere Informationen