Instanzen mit Cloud Monitoring beobachten

In diesem Dokument wird beschrieben, wie Sie mit der Cloud Monitoring-Konsole Spanner-Instanzen überwachen.

Die Cloud Monitoring-Konsole bietet verschiedene Monitoring-Tools für Spanner:

Wenn Sie Spanner programmatisch überwachen möchten, verwenden Sie die Cloud-Clientbibliotheken für Cloud Monitoring zum Abrufen von Messwerten.

Von Cloud Monitoring ausgewählte Dashboards verwenden

In Cloud Monitoring steht ein gepflegtes Dashboard mit ausgewählten Inhalten zur Verfügung, das wichtige Informationen zu Ihren Spanner-Instanzen zusammenfasst:

  • Vorfälle: Vom Nutzer erstellte Monitoring-Benachrichtigungen, die den Status "offen", "aktiv" oder "behoben" haben können
  • Ereignisse: Eine Liste der Audit-Logs in Spanner (falls aktiviert und verfügbar)
  • Instanzen: Eine überblicksartige Zusammenfassung Ihrer Spanner-Instanzen einschließlich der Rechenkapazität, der Datenbankanzahl und des Instanzzustands
  • Aggregierte Diagramme zu Durchsatz und Speichernutzung

So rufen Sie das Spanner-Dashboard auf:

  1. Wählen Sie in der Google Cloud Console Monitoring aus oder klicken Sie auf die folgende Schaltfläche:

    Zu Monitoring

  2. Wenn im Navigationsbereich Ressourcen angezeigt wird, wählen Sie Ressourcen und dann Cloud Spanner aus. Wählen Sie andernfalls Dashboards und dann das Dashboard mit dem Namen Cloud Spanner aus.

Instanz- und Datenbankdetails aufrufen

Wenn Sie das Dashboard mit ausgewählten Inhalten für Spanner öffnen, werden zusammengefasste Daten für alle Instanzen angezeigt. Sie erhalten weitere Details zu den einzelnen Instanzen, wenn Sie unter Instanzen auf den jeweiligen Instanznamen klicken.

Das Dashboard zeigt Informationen wie Instanzmetadaten, Datenbanken in der Instanz und Diagramme verschiedener Messwerte nach Region an.

Auf der Instanz-Dashboard-Seite können Sie auch Diagramme für eine bestimmte Datenbank in der Instanz aufrufen:

  1. Klicken Sie auf der rechten Seite über den Diagrammen zu den Instanzmesswerten auf Datenbankmesswerte.

  2. Wählen Sie in der Drop-down-Liste Aufschlüsselung auswählen die Datenbank aus, die Sie untersuchen möchten.

    In der Cloud Monitoring Console werden Diagramme für die Datenbank angezeigt.

Benutzerdefinierte Diagramme für Spanner-Messwerte erstellen

Mit Cloud Monitoring können Sie benutzerdefinierte Diagramme für Spanner-Messwerte erstellen. Mit Metrics Explorer erstellen Sie temporäre Ad-hoc-Diagramme oder Diagramme, die in benutzerdefinierten Dashboards angezeigt werden.

Insbesondere können Sie in Cloud Monitoring ein benutzerdefiniertes Diagramm erstellen, das anzeigt, ob zwei oder mehr Messwerte miteinander in Beziehung stehen. Beispielsweise haben Sie die Möglichkeit, in einer Spanner-Instanz zu prüfen, ob eine Korrelation zwischen CPU-Auslastung und Latenz besteht. Dies würde gegebenenfalls darauf hindeuten, dass Ihre Instanz mehr Rechenkapazität benötigt oder dass einige Ihrer Abfragen zu einer hohen CPU-Auslastung führen.

Führen Sie die folgenden Schritte aus, um mit diesem Beispiel zu starten:

  1. Wählen Sie in der Google Cloud Console Monitoring aus oder klicken Sie auf die folgende Schaltfläche:

    Zu Monitoring

  2. Wenn der Metrics Explorer im Navigationsbereich angezeigt wird, klicken Sie darauf. Wählen Sie andernfalls Ressourcen und dann Metrics Explorer aus.

  3. Klicken Sie auf Ansichtsoptionen und dann auf das Kästchen Log-Skalierung auf Y-Achse. Mit dieser Option können Sie mehrere Messwerte vergleichen, wenn ein Messwert sehr viel größere Werte als die anderen aufweist.

  4. Wählen Sie in der Drop-down-Liste über dem rechten Bereich Zeile aus.

  5. Klicken Sie auf den Tab Messwerte. Sie können jetzt Messwerte zum Diagramm hinzufügen.

So fügen Sie dem Diagramm Latenzmesswerte hinzu:

  1. Geben Sie im Feld Ressourcentyp und Messwert suchen den Wert spanner.googleapis.com/api/request_latencies ein und klicken Sie dann auf die Zeile, die unter dem Feld angezeigt wird.
  2. Geben Sie im Feld Filter den Wert instance_id ein. Geben Sie dann die Instanz-ID ein, die Sie prüfen möchten, und klicken Sie auf Übernehmen.
  3. Klicken Sie in der Drop-down-Liste Aggregator auf max.
  4. Optional: Ändern Sie das Latenzperzentil:

    1. Klicken Sie auf Erweiterte Optionen einblenden.
    2. Klicken Sie auf die Drop-down-Liste Aligner und dann auf das Latenzperzentil, das Sie aufrufen möchten.

      In den meisten Fällen ist es sinnvoll, entweder einen Blick auf die Latenz des 50. Perzentils zu werfen, um die typische Latenz nachzuvollziehen, oder auf die Latenz des 99. Perzentils, um mögliche Gründe für die Latenz für die langsamsten 1 % der Anfragen zu erkennen.

Führen Sie die folgenden Schritte aus, um Messwerte zur CPU-Auslastung zum Diagramm hinzuzufügen:

  1. Klicken Sie auf Messwert hinzufügen.
  2. Geben Sie im Feld Ressourcentyp und Messwert suchen den Wert spanner.googleapis.com/instance/cpu/utilization ein und klicken Sie dann auf die Zeile, die unter dem Feld angezeigt wird.
  3. Geben Sie im Feld Filter den Wert instance_id ein. Geben Sie dann die Instanz-ID ein, die Sie prüfen möchten, und klicken Sie auf Übernehmen.
  4. Klicken Sie in der Drop-down-Liste Aggregator auf max.

Es steht jetzt ein Diagramm zur Verfügung, das die CPU-Auslastung und die Latenzmesswerte für eine Spanner-Instanz anzeigt. Wenn beide Messwerte gleichzeitig höher als erwartet sind, können Sie weitere Maßnahmen ergreifen, um das Problem zu beheben.

Weitere Informationen zum Erstellen benutzerdefinierter Diagramme finden Sie in der Cloud Monitoring-Dokumentation.

Benachrichtigungen für Spanner-Messwerte erstellen

Beim Erstellen einer Spanner-Instanz wählen Sie die Rechenkapazität für die Instanz aus. Wenn sich die Arbeitslast der Instanz ändert, passt Spanner die Rechenkapazität der Instanz nicht automatisch an. Daher müssen Sie mehrere Benachrichtigungen einrichten, damit die Instanz innerhalb der empfohlenen Höchstwerte für die CPU-Auslastung und des empfohlenen Limits für den Speicher verbleibt.

Die folgenden Beispiele zeigen, wie Sie Benachrichtigungsrichtlinien für einige Spanner-Messwerte einrichten. Eine vollständige Liste der verfügbaren Messwerte finden Sie unter Liste der Messwerte für Spanner.

CPU mit hoher Priorität

Mit den folgenden Einstellungen können Sie eine Benachrichtigungsrichtlinie erstellen, die ausgelöst wird, wenn die Auslastung ihrer hochprioritären CPU für Spanner über einem empfohlenen Schwellenwert liegt:

Neue Bedingung
Feld

Wert
Ressource und Messwert Wählen Sie im Menü Ressourcen die Option Spanner-Instanz aus.
Wählen Sie im Menü Messwertkategorien die Option Instanz aus.
Wählen Sie im Menü Messwerte die Option CPU-Auslastung nach Priorität aus.

(Der Messwerttyp ist spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Über Zeitreihen
Zeitreihen gruppieren nach
location für multiregionale Instanzen;
bei regionalen Instanzen frei lassen.
Über Zeitreihen hinweg
Zeitreihenaggregation
sum
Rollierendes Zeitfenster 10 m
Funktion für rollierendes Zeitfenster mean
Benachrichtigungstrigger konfigurieren
Feld

Wert
Bedingungstyp Threshold
Benachrichtigungstrigger Any time series violates
Grenzwertposition Above threshold
Grenzwert 45% für multiregionale Instanzen;
65% für regionale Instanzen.
Zeitfenster noch einmal testen 10 minutes

Gleitender 24-Stunden-Durchschnitt der CPU

Für eine Benachrichtigungsrichtlinie, die ausgelöst wird, wenn der gleitende 24-Stunden-Durchschnitt Ihrer CPU-Auslastung für Spanner einen empfohlenen Schwellenwert überschreitet, verwenden Sie die folgenden Einstellungen:

Neue Bedingung
Feld

Wert
Ressource und Messwert Wählen Sie im Menü Ressourcen die Option Spanner-Instanz aus.
Wählen Sie im Menü Messwertkategorien die Option Instanz aus.
Wählen Sie im Menü Messwerte die Option Glättete CPU-Auslastung aus.

(Der Messwerttyp ist spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filter instance_id = YOUR_INSTANCE_ID
Über Zeitreihen hinweg
Zeitreihenaggregation
sum
Rollierendes Zeitfenster 10 m
Funktion für rollierendes Zeitfenster mean
Benachrichtigungstrigger konfigurieren
Feld

Wert
Bedingungstyp Threshold
Benachrichtigungstrigger Any time series violates
Grenzwertposition Above threshold
Grenzwert 90%
Zeitfenster noch einmal testen 10 minutes

Speicherplatz

Für eine Benachrichtigungsrichtlinie, die ausgelöst wird, wenn der Speicher für Ihre Spanner-Instanz über einem empfohlenen Schwellenwert liegt, verwenden Sie die folgenden Einstellungen:

Neue Bedingung
Feld

Wert
Ressource und Messwert Wählen Sie im Menü Ressourcen die Option Spanner-Instanz aus.
Wählen Sie im Menü Messwertkategorien die Option Instanz aus.
Wählen Sie im Menü Messwerte die Option Verwendeter Speicher aus.

(Der Messwerttyp ist spanner.googleapis.com/instance/storage/utilization).
Filter instance_id = YOUR_INSTANCE_ID
Über Zeitreihen hinweg
Zeitreihenaggregation
sum
Rollierendes Zeitfenster 10 m
Funktion für rollierendes Zeitfenster max
Benachrichtigungstrigger konfigurieren
Feld

Wert
Bedingungstyp Threshold
Bedingung wird ausgelöst, wenn Any time series violates
Grenzwertposition Above threshold
Grenzwert Sie müssen keinen bestimmten Grenzwert für den maximalen Speicherplatz pro Knoten festlegen. Wir empfehlen Ihnen jedoch, eine Benachrichtigung einzurichten, wenn Sie das maximale Speicherlimit erreichen. Weitere Informationen finden Sie unter Messwerte zur Speicherauslastung.
Zeitfenster noch einmal testen 10 minutes

Nächste Schritte