Anwendungsfall: GKE-Verbindungsprobleme beheben

In diesem Anwendungsfall sind Sie der Administrator eines Netzwerks, das mehrere GKE-Namespaces umfasst. Sie wurden über ein Latenzproblem informiert und Ihnen wurde mitgeteilt, dass die App Ihres Unternehmens zeitweise langsam ist und es zu Zeitüberschreitungen kommt. Sie wissen, dass eine Reihe verschiedener Nutzer betroffen sind und dass in letzter Zeit keine Anwendungsbereitstellungen stattgefunden haben. Das Problem hängt wahrscheinlich mit einem bestimmten GKE-Cluster zusammen.

Der folgende Anwendungsfall zeigt, wie Sie mithilfe von Netzwerktopologie Probleme in Ihrer GKE-Bereitstellung schnell prüfen und beheben können.

Topologie – Details

Die Bereitstellung umfasst drei Regionen in Google Cloud (us-central1, europe-west1 und asia-east1). Alle externen Clientanfragen werden von den drei Clustern in den drei Regionen mit mehreren Namespaces verarbeitet. Clientanfragen aus einer von drei Geschäftsregionen (Amerika, EMEA und APAC) werden von Anwendungsinstanzen in der nächstgelegenen Region vonGoogle Cloud verarbeitet.

Das folgende Topologiediagramm zeigt die allgemeine Hierarchie der Bereitstellung:

Netzwerklatenz

Nehmen Sie in diesem Szenario an, dass Sie einen GKE-Cluster mit dem Namen „online-boutique“ haben. Sie prüfen die Latenz zwischen externen Clients und dem GKE-Cluster, um festzustellen, ob sich die Latenz geändert hat. Sie sehen, dass dies der Fall ist, und beschließen, die Knoten des Clusters genauer zu prüfen.

  1. Sie filtern die Topologie so, dass nur der Traffic für Ihren Cluster online-boutique angezeigt wird.

    Im Abschnitt Filter können Sie einen Filter hinzufügen, um Knoten und zugehörige Peers auszuwählen. Dieser Abschnitt ist nur für Messwertansichten und nicht für Insight-Ansichten verfügbar. Klicken Sie auf Filter hinzufügen und wählen Sie den Knotentyp und den Knoten aus.

    Nachdem Sie den Filter angewendet haben, zeigt Netzwerktopologie nur Verbindungen mit Bezug zu dem Cluster an, wie im folgenden Beispiel gezeigt.

  2. Beginnend mit den externen Clients in Amerika klicken Sie auf die Traffic-Messwerte zwischen der Geschäftsregion „Amerika“ und dem GKE-Cluster. Netzwerktopologie zeigt Diagramme im Detailbereich an. Die Informationen umfassen eingehenden und ausgehenden Traffic zwischen der ausgewählten und der verbundenen Entität. Beispielsweise liefert Netzwerktopologie die neuesten Werte für Abfragen pro Sekunde und die Latenz für HTTP-Anfragen. Im Diagramm der Anfragelatenz sehen Sie Werte für das 50., 95. und 99. Perzentil. In diesem Beispiel wird davon ausgegangen, dass alle Latenzwerte höher sind als erwartet.

  3. Wenn Sie die Zeitreihendiagramme auf 6 Wochen erweitern möchten, wählen Sie oben im Detailbereich 6 Wochen aus.

    Sie sehen einen signifikanten Sprung, der vor etwa zwei Stunden aufgetreten ist. Dies ist ungefähr der Zeitpunkt, zu dem die ersten Probleme gemeldet wurden. Sie sind sicher, dass das Problem mit einer erhöhten Latenz eines GKE-Pods zusammenhängt.

  4. Da Sie jetzt einen groben Überblick über das Problem haben, prüfen Sie die GKE-Knoten eingehender. Weitere Informationen zur Problembehebung bei GKE-Knoten finden Sie auf der Seite zur Behebung von GKE-Verbindungsproblemen.

Weitere Informationen