GKE-Cluster beobachten

Auf dieser Seite wird gezeigt, wie Sie auf die Monitoring-Dashboards von Cloud Operations for GKE und von Legacy-Logging und -Monitoring zugreifen und wie Sie das Monitoring-Dashboard von Cloud Operations for GKE verwenden.

Zugriff auf das Monitoring-Dashboard

  1. Wechseln Sie in der Cloud Console zu Monitoring:

    Zu Monitoring

  2. Wählen Sie die Option Dashboards und dann eines der folgenden Dashboards aus:

    • Wählen Sie für Cluster mit aktiviertem Cloud Operations for GKE das Dashboard mit dem Namen GKE aus.

    • Wählen Sie für Cluster mit aktiviertem Legacy-Logging und -Monitoring das Dashboard mit dem Namen GKE Clusters aus.

    Wenn Sie keine Cluster oder nicht alle Ressourcen in Ihren Clustern sehen, lesen Sie Fehlerbehebung für Ihr GKE-Dashboard.

Dashboard-Oberfläche für Cloud Operations for GKE

Das Cloud Operations for GKE-Dashboard ist in mehrere Teile unterteilt:

Tabellenansicht des Cloud Operations for GKE-Dashboards aufrufen.

  1. Mit der Filterleiste können Sie die GKE-Ressourcen auswählen, nach denen im Dashboard gefiltert werden soll.

  2. Auf der Zeitachse für Benachrichtigungen können Sie eine bestimmte Zeitspanne für Ihr Dashboard auswählen. Außerdem wird eine Zusammenfassung der Benachrichtigungen für diesen Zeitraum angezeigt.

  3. In den Tabellen ist der GKE-Gerätepool nach Typ aufgelistet: Cluster, Namespace, Knoten, Arbeitslasten, Dienste, Pods und Container. Jede Zeile enthält eine einzelne Ressource mit Messwerten. Wenn Sie auf eine Zeile klicken, wird ein Feld mit weiteren Details zu dieser Ressource angezeigt.

Filterleiste

Mit der Filterleiste können Sie die im Dashboard angezeigten GKE-Ressourcen filtern, damit die für Sie relevanten Daten angezeigt werden. Außerdem werden Informationen aus anderen Ressourcen in Ihrem Cluster angezeigt, die Ihrer Filterauswahl entsprechen.

Filterleiste verwenden

Führen Sie die folgenden Schritte aus, um die Daten in Ihrem Dashboard zu filtern.

  1. Klicken Sie auf die Filterleiste, um die Filteroptionen aufzurufen.

    Anzeige der Filteroptionen

  2. Wählen Sie eine Kubernetes-Ressource aus, nach der Sie filtern möchten, und wählen Sie dann den Ressourcennamen aus.

    Wenn mehr als eine Ressource diesen Namen hat, wählen Sie eine bestimmte Ressourceninstanz aus, nach der Sie filtern möchten.

  3. Klicken Sie auf Anwenden.

    Das Dashboard wird aktualisiert und die aktualisierten Informationen werden angezeigt.

Beachten Sie bei der Verwendung der Filterleiste Folgendes:

  • Nachdem Sie einen Filter auf das Dashboard angewendet haben, können Sie noch einmal auf die Filterleiste klicken, um nach zusätzlichen Ressourcen zu filtern.

  • Für einige Ressourcen sind im Filtermenü möglicherweise zu viele Optionen verfügbar, die nicht alle angezeigt werden können. In diesem Fall müssen Sie zuerst nach einer übergeordneten Ressource filtern, um die Optionen einzugrenzen. Wenn Sie beispielsweise zu viele Pods haben, die nicht alle angezeigt werden können, haben Sie die Möglichkeit, zuerst nach Cluster oder einer anderen Kubernetes-Ressource zu filtern, um die Liste der Pods einzugrenzen.

  • Um den Umfang jedes Filterstrings zu verdeutlichen, werden auf der Filteroberfläche standardmäßig möglicherweise zusätzliche Filter angezeigt, die sich nach der Ressource richten, nach der Sie filtern. Wenn Sie beispielsweise nach einem bestimmten Namespace filtern, fügt der Filter den Cluster hinzu, in dem sich der Namespace befindet.

    Anzeige zusätzlicher vom System ausgewählter Filteroptionen

Benachrichtigungszeitachse

Die Zeitachse enthält eine Übersicht über die Benachrichtigungen in Ihren Clustern. Die Zeitachse der Benachrichtigungen bietet Ihnen eine Übersicht über die innerhalb des ausgewählten Zeitraums aufgetretenen Verstöße mit Benachrichtigung. Wenn Sie den Mauszeiger auf einem roten Bereich in der Zeitachse platzieren, werden Ereigniskarten angezeigt.

Zeitachsenansicht einer Kubernetes-Benachrichtigung verwenden.

Jede Ereigniskarte enthält detaillierte Informationen zu einer Benachrichtigung, die in der Zeitachse angezeigt wird.

Im Drop-down-Menü für den Zeitraum können Sie den Zeitraum für die Benachrichtigungszeitachse und die Tabellen in Ihrem Dashboard festlegen.

Ereigniskarten verwenden

Wenn Sie den Mauszeiger auf die Benachrichtigungszeitachse bewegen, werden im Dashboard Ereigniskarten für jeden Verstoß mit Benachrichtigung angezeigt. Eine Benachrichtigung mit gibt an, dass der Vorfall noch offen ist, während eine Benachrichtigung mit anzeigt, dass der Vorfall geschlossen wurde.

Wenn der ausgewählte Zeitraum mehr als zwei Benachrichtigungen umfasst, können Sie mit dem Mausrad durch die Ereigniskarten scrollen. Sie können auch auf Alle Benachrichtigungen ansehen klicken, um alle Ereigniskarten in einem Steuerfeld anzeigen zu lassen.

Klicken Sie auf Vorfall ansehen, um sich den Vorfall in „Benachrichtigungen“ anzusehen.

Im Bereich Zugeordnete Ressource wird auf der Ereigniskarte angezeigt, welcher Ressource die Benachrichtigung zugeordnet ist. Wenn das Dashboard nicht ermitteln kann, welcher Ressource die Benachrichtigung zugeordnet ist, wird auf der Ereigniskarte der Link Benachrichtigungsrichtlinie aktualisieren angegeben, der zur Seite Benachrichtigungsrichtlinie bearbeiten führt. Von hier aus können Sie die Benachrichtigungsrichtlinie mit zusätzlichen Informationen aktualisieren, sodass das Dashboard die zugeordnete Ressource finden kann.

Dashboard-Tabellen

Im Dashboard wird für jede GKE-Ressource eine Tabelle mit Messwerten angezeigt. Die Tabellen enthalten die folgenden Spalten:

  • Name: Der Anzeigename der Ressource.

  • Benachrichtigungen: Die Anzahl der offenen und bestätigten Benachrichtigungen für diese Ressource und ihre untergeordneten Elemente, die während des ausgewählten Zeitraums ausgelöst wurden.

  • Service Level Objectives (SLOs): Eine Anweisung der gewünschten Leistung für Ihre Dienste, gemessen mit dem ausgewählten Service Level Indicator (SLI).

  • Container-Neustarts: Die Anzahl der Neustarts eines Containers im ausgewählten Zeitraum.

  • Fehlerlogs: Die Anzahl der Fehlerlogs, die einer Entität basierend auf dem ausgewählten Zeitraum zugeordnet sind.

  • CPU-Auslastung: Die CPU-Auslastung von Containern, die einer Ressource im ausgewählten Zeitraum zugeordnet werden kann.

  • Speicherauslastung: Die Speicherauslastung von Containern, die einer Ressource im ausgewählten Zeitraum zugeordnet werden kann.

    • Der verwendete Messwert ist kubernetes.io/container/memory/request_utilization. Es gibt zwei Arten von Arbeitsspeicher: entfernbar und nicht entfernbar. Der entfernbare Speicher ist Speicher, der aus der Ressource entfernt wird, wenn die Nutzung zu hoch wird. Wenn die nicht entfernbare Speichernutzung die Limits überschreitet, kann der Container beendet werden. Weitere Informationen zu Ressourcenlimits finden Sie unter Anfragen und Limits.
  • Laufwerksauslastung: Die Laufwerksauslastung von Pods, die einer Ressource im ausgewählten Zeitraum zugeordnet werden kann. Im Gegensatz zu den vorherigen beiden Spalten wird dieser Messwert von Pods erstellt und nicht in der Tabelle Container angezeigt.

Beachten Sie für die Auslastungsspalten die folgenden Informationen:

  • Diese Spalten enthalten keine Quote, sondern es werden zwei unterschiedliche Datenpunkte angezeigt, die durch / getrennt sind. Die erste Zahl zeigt die für diese einzelne Ressource angeforderte Gesamtkapazität an. Die zweite Zahl steht für die prozentuale Auslastung der angeforderten Kapazität.

  • Die Sparklines zeigen die Auslastungsdaten über den auf der Seite ausgewählten Zeitraum.

Dashboard-Tabellen konfigurieren

Sie können die Tabellen im Dashboard so konfigurieren, dass die Informationen angezeigt werden, die Sie am meisten interessieren. Mit dem Drop-down-Menü Ressourcentabellen konfigurieren neben der Filterleiste können Sie die anzuzeigenden Spalten auswählen. Sie können auch auswählen, ob Sparklines in den Tabellen angezeigt werden sollen.

Diese Konfigurationen gelten für alle Tabellen im Dashboard.

Anzeige des Drop-down-Menüs „Ressourcentabellen konfigurieren”

Führen Sie die folgenden Schritte aus, um Ihre Tabellen zu konfigurieren.

  1. Wählen Sie das Drop-down-Menü „Ressourcentabellen konfigurieren” aus.

  2. Wählen Sie die Spalten aus, die in den Tabellen angezeigt werden sollen.

    Die Spalten Name und Aktive Benachrichtigungen sind erforderlich.

  3. Wählen Sie aus, ob Sparklines angezeigt werden sollen.

  4. Klicken Sie auf Übernehmen, um die Änderungen vorzunehmen.

Ressourcendetails ansehen

Im Cloud Operations for GKE-Dashboard wird standardmäßig für jede Kubernetes-Ressource eine Zusammenfassungszeile angezeigt. Wenn Sie auf eine Zeile in einer Tabelle klicken, werden die Details für diese Ressource angezeigt.

Anzeige eines Ressourcendetails

Im Bereich mit den Ressourcendetails werden Informationen zur ausgewählten Ressource angezeigt. Er enthält auch den Tab Benachrichtigungen mit Informationen zu offenen Benachrichtigungen und den Tab Ereignisse mit den Kubernetes-Ereignissen, die mit der ausgewählten Ressource verknüpft sind. Außerdem enthält er den Tab Messwerte, auf dem Messwerte in Diagrammen angezeigt werden, und den Tab Logs, auf dem die von der Ressource generierten Logs angezeigt werden.

Klicken Sie auf Benachrichtigungen ansehen, um sich den Vorfall in „Benachrichtigungen“ anzusehen.

Kubernetes-Ereignisse ansehen

Der Tab Ereignisse im Bereich „Ressourcendetails” zeigt die mit der Ressource verknüpften Kubernetes-Ereignisse an. Kubernetes-Ereignisse sind für alle Ressourcen außer Container verfügbar.

Darstellung eines Tabs "Ereignis" für ein Ressourcendetail.

Der Tab Ereignisse enthält eine Reihe von Karten mit Informationen zu jedem Ereignis. Eine Karte enthält auch einen Link zur zugehörigen Ressource, wenn das Ereignis in einer niedrigeren Ressource aufgetreten ist. Sie können auf Log ansehen klicken, um den Log-Explorer zu öffnen, um das mit dem Ereignis verknüpfte Log aufzurufen. Sie können auch auf Nachricht kopieren klicken, um die Log-Nachricht in die Zwischenablage zu kopieren.

Klicken Sie auf In Logging ansehen, um alle Ereignisse im Log-Explorer aufzurufen. Im Log-Explorer werden alle Logs angezeigt, die mit den Kubernetes-Ereignissen verknüpft sind.

SLOs verwalten

Mit Service Level Objectives (SLOs) können Sie den Zustand und die Leistung Ihrer Anwendungen verfolgen. Nach dem Konfigurieren des Dashboards zur Anzeige der Spalte Service Level Objectives (SLOs) können Sie sehen, ob Ihre Anwendungen die SLOs erfüllen. Das SLO Ihrer Ressource kann einen der folgenden Status haben:

  • Gesund: Gibt an, dass die Ressource dem angegebenen SLO entspricht. Dieser Statuswert hat einen grünen Indikator.

  • Fehlerbudget überschritten: Gibt an, dass das Fehlerbudget der Ressource ausgeschöpft ist. Das bedeutet, dass weitere Fehler dazu führen können, dass Ihre Ressource gegen das SLO verstoßen. Dieser Statuswert hat einen gelben Indikator.

  • Ungesund: Gibt an, dass die Ressource gegen das SLO verstößt und eine Benachrichtigung ausgelöst wurde. Dieser Statuswert hat einen roten Indikator.

  • Kein Status: Gibt an, dass für dieses SLO keine Daten vorhanden sind. Dieser Statuswert hat einen grauen Indikator.

Weitere Informationen zu diesen Konzepten finden Sie unter Service Monitoring-Konzepte.

SLO-Details

Sie können SLOs nur für die folgenden Kubernetes-Ressourcen definieren: Namespaces, Arbeitslasten und Kubernetes-Dienste. Für detaillierte Informationen zur SLO-Compliance Ihrer Ressource klicken Sie auf die Ressource, um den Detailbereich zu öffnen. Klicken Sie im Detailbereich auf den Tab SLOS.

Anzeige des Tabs "SLOs" im Detailbereich.

SLO erstellen

Sie können ein SLO für die Kubernetes-Ressource über das Monitoring-Dashboard von Cloud Operations for GKE erstellen.

Klicken Sie auf der Seite GKE-Dashboard in der Zeile der Kubernetes-Ressource auf , um den Bereich Service Level Objective (SLO) aufzurufen.

Klicken Sie im Detailbereich der Ressource auf SLO erstellen, um das Feld Service Level Objective (SLO) erstellen zu öffnen.

Anzeige des SLOs-Erstellungsfensters.

Informationen zum Ausfüllen des Formulars zum Erstellen eines SLO finden Sie in der Anleitung SLO erstellen.

Logs im Log-Explorer ansehen

Sie können die Logdaten Ihres Clusters mit dem Log-Explorer suchen und ansehen. Mit dem Log-Explorer können Sie Ihre Logs ansehen, Ihre Logdaten parsen und analysieren und Ihre Abfrageparameter verfeinern.

Ausführliche Informationen zur Verwendung von Log-Explorer finden Sie in der Logging-Dokumentation.

Fehlerbehebung

Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung für Ihr GKE-Dashboard.