Anwendungsfall: Probleme mit GKE-Konnektivität beheben

In diesem Anwendungsfall sind Sie ein Netzwerkadministrator und unterstützen ein Netzwerk mit mehreren GKE-Namespaces. Sie wurden über ein Latenzproblem informiert und Ihnen wurde mitgeteilt, dass die mobile Anwendung Ihrer Organisation zeitweise langsam ist und eine Zeitüberschreitung auftritt. Sie wissen, dass eine Reihe verschiedener Nutzer betroffen sind und in letzter Zeit keine Anwendungsbereitstellungen stattgefunden haben. Das Problem hängt wahrscheinlich mit einem bestimmten GKE-Cluster zusammen.

Der folgende Anwendungsfall zeigt, wie Sie mit Netzwerktopologie Probleme in Ihrer GKE-Bereitstellung schnell beheben und untersuchen können.

Topologie – Details

Die Bereitstellung erstreckt sich über drei Google Cloud-Regionen (us-central1, europe-west1 und asia-east1). Alle externen Clientanfragen werden von den drei Clustern innerhalb der drei Regionen mit mehreren Namespaces verarbeitet. Clientanfragen aus einer von drei Geschäftsregionen (Amerika, EMEA und APAC) werden von Anwendungsinstanzen in der nächstgelegenen Google Cloud-Region verarbeitet.

Die folgende Topologie zeigt die oberste Hierarchie für die Bereitstellung:

Netzwerklatenz

Nehmen Sie in diesem Szenario an, dass Sie einen GKE-Cluster namens „online-boutique“ haben. Sie prüfen die Latenz zwischen externen Clients und dem GKE-Cluster, um festzustellen, ob sich die Latenz zwischen ihnen geändert hat. Sie stellen fest, dass er sich geändert hat, und beschließen, die Knoten des Clusters weiter zu untersuchen.

  1. Sie filtern die Topologie so, dass nur der Traffic für den Cluster online-boutique angezeigt wird.

    Im Abschnitt Filter können Sie einen Filter hinzufügen, um Knoten und zugehörige Peers auszuwählen. Dieser Abschnitt ist nur für Messwertansichten und nicht für Statistikansichten verfügbar. Klicken Sie auf Filter hinzufügen und wählen Sie den Knotentyp und den Knoten aus.

    Nachdem Sie den Filter angewendet haben, zeigt Netzwerktopologie nur die Verbindungen an, die sich auf den Cluster beziehen, wie im folgenden Beispiel gezeigt.

  2. Beginnend mit den externen Clients in Amerika klicken Sie auf die Traffic-Messwerte zwischen der Geschäftsregion Amerika und dem GKE-Cluster. Netzwerktopologie zeigt Diagramme im Detailbereich an. Die Informationen umfassen eingehenden und ausgehenden Traffic zwischen der ausgewählten Entität und der verbundenen Entität. Beispielsweise stellt Netzwerktopologie die neuesten Werte für Abfragen pro Sekunde und die HTTP-Anfragelatenz bereit. Im Diagramm der Anfragelatenz sehen Sie Werte für das 50., 95. und 99. Perzentil. In diesem Beispiel wird davon ausgegangen, dass alle Latenzwerte höher sind als erwartet.

  3. Wenn Sie die Zeitachsendiagramme auf 6 Wochen erweitern möchten, wählen Sie oben im Detailbereich 6 Wochen aus.

    Sie sehen einen signifikanten Sprung, der vor etwa zwei Stunden aufgetreten ist. Dies ist ungefähr der Zeitpunkt, zu dem die ersten Probleme gemeldet wurden. Sie sind sich sicher, dass das Problem mit der erhöhten Latenz bei einem GKE-Pod zusammenhängt.

  4. Im allgemeinen Überblick über das Problem untersuchen Sie die GKE-Knoten genauer. Weitere Informationen zur Fehlerbehebung bei GKE-Knoten finden Sie unter Fehlerbehebung bei GKE-Verbindungsproblemen.

Nächste Schritte