Monitoring mit Cloud Monitoring

In diesem Dokument wird beschrieben, wie Sie mit der Cloud Monitoring-Konsole Cloud Spanner-Instanzen überwachen.

Die Cloud Monitoring-Konsole bietet verschiedene Monitoring-Tools für Cloud Spanner:

Wenn Sie Cloud Spanner programmatisch überwachen möchten, verwenden Sie die Cloud-Clientbibliotheken für Cloud Monitoring zum Abrufen von Messwerten.

Hinweis

Sie benötigen einen Arbeitsbereich, um Cloud Monitoring verwenden zu können. Wenn Sie keinen Arbeitsbereich haben, können Sie einen neuen Arbeitsbereich erstellen.

Verwenden der von Cloud Monitoring ausgewählten Dashboards

In Cloud Monitoring steht ein gepflegtes Dashboard mit ausgewählten Inhalten zur Verfügung, das wichtige Informationen zu Ihren Cloud Spanner-Instanzen zusammenfasst:

  • Vorfälle: Vom Nutzer erstellte Monitoring-Benachrichtigungen, die den Status "offen", "aktiv" oder "behoben" haben können
  • Ereignisse: Eine Liste der Audit-Logs in Cloud Spanner (falls aktiviert und verfügbar)
  • Instanzen: Eine überblicksartige Zusammenfassung Ihrer Cloud Spanner-Instanzen einschließlich der Knotenanzahl, Datenbankanzahl und des Instanzzustands
  • Aggregierte Diagramme zu Durchsatz und Speichernutzung

So rufen Sie das Cloud Spanner-Dashboard auf:

  1. Wählen Sie in der Google Cloud Console Monitoring aus oder klicken Sie auf den folgenden Link:

    Zu Monitoring

  2. Wenn im Navigationsbereich Ressourcen angezeigt wird, wählen Sie Ressourcen und dann Cloud Spanner aus. Wählen Sie andernfalls Dashboards und dann das Dashboard mit dem Namen Cloud Spanner aus.

Instanz- und Datenbankdetails aufrufen

Wenn Sie das Dashboard mit ausgewählten Inhalten für Cloud Spanner öffnen, werden zusammengefasste Daten für alle Instanzen angezeigt. Sie erhalten weitere Details zu den einzelnen Instanzen, wenn Sie unter Instanzen auf den jeweiligen Instanznamen klicken.

Das Dashboard zeigt Informationen wie Instanzmetadaten, Datenbanken in der Instanz und Diagramme verschiedener Messwerte nach Region an.

Auf der Instanz-Dashboard-Seite können Sie auch Diagramme für eine bestimmte Datenbank in der Instanz aufrufen:

  1. Klicken Sie auf der rechten Seite über den Diagrammen zu den Instanzmesswerten auf Datenbankmesswerte.

  2. Wählen Sie in der Drop-down-Liste Aufschlüsselung auswählen die Datenbank aus, die Sie untersuchen möchten.

    In der Cloud Monitoring Console werden Diagramme für die Datenbank angezeigt.

Benutzerdefinierte Diagramme für Cloud Spanner-Messwerte erstellen

Mit Cloud Monitoring können Sie benutzerdefinierte Diagramme für Cloud Spanner-Messwerte erstellen. Mit Metrics Explorer erstellen Sie temporäre Ad-hoc-Diagramme oder Diagramme, die in benutzerdefinierten Dashboards angezeigt werden.

Insbesondere können Sie in Cloud Monitoring ein benutzerdefiniertes Diagramm erstellen, das anzeigt, ob zwei oder mehr Messwerte miteinander in Beziehung stehen. Beispielsweise haben Sie die Möglichkeit, in einer Cloud Spanner-Instanz zu prüfen, ob eine Korrelation zwischen CPU-Auslastung und Latenz besteht. Dies würde gegebenenfalls darauf hindeuten, dass Ihre Instanz mehr Knoten benötigt oder dass einige Ihrer Abfragen zu einer hohen CPU-Auslastung führen.

Führen Sie die folgenden Schritte aus, um mit diesem Beispiel zu starten:

  1. Wählen Sie in der Google Cloud Console Monitoring aus oder klicken Sie auf den folgenden Link:

    Zu Monitoring

  2. Wenn der Metrics Explorer im Navigationsbereich angezeigt wird, klicken Sie darauf. Wählen Sie andernfalls Ressourcen und dann Metrics Explorer aus.

  3. Klicken Sie auf Ansichtsoptionen und dann auf das Kästchen Log-Skalierung auf Y-Achse. Mit dieser Option können Sie mehrere Messwerte vergleichen, wenn ein Messwert sehr viel größere Werte als die anderen aufweist.

  4. Wählen Sie in der Drop-down-Liste über dem rechten Bereich Zeile aus.

  5. Klicken Sie auf den Tab Messwerte. Sie können jetzt Messwerte zum Diagramm hinzufügen.

So fügen Sie dem Diagramm Latenzmesswerte hinzu:

  1. Geben Sie im Feld Ressourcentyp und Messwert suchen den Wert spanner.googleapis.com/api/request_latencies ein und klicken Sie dann auf die Zeile, die unter dem Feld angezeigt wird.
  2. Geben Sie im Feld Filter den Wert instance_id ein. Geben Sie dann die Instanz-ID ein, die Sie prüfen möchten, und klicken Sie auf Übernehmen.
  3. Klicken Sie in der Drop-down-Liste Aggregator auf max.
  4. Optional: Ändern Sie das Latenzperzentil:

    1. Klicken Sie auf Erweiterte Optionen einblenden.
    2. Klicken Sie auf die Drop-down-Liste Aligner und dann auf das Latenzperzentil, das Sie aufrufen möchten.

      In den meisten Fällen ist es sinnvoll, entweder einen Blick auf die Latenz des 50. Perzentils zu werfen, um die typische Latenz nachzuvollziehen, oder auf die Latenz des 99. Perzentils, um mögliche Gründe für die Latenz für die langsamsten 1 % der Anfragen zu erkennen.

Führen Sie die folgenden Schritte aus, um Messwerte zur CPU-Auslastung zum Diagramm hinzuzufügen:

  1. Klicken Sie auf Messwert hinzufügen.
  2. Geben Sie im Feld Ressourcentyp und Messwert suchen den Wert spanner.googleapis.com/instance/cpu/utilization ein und klicken Sie dann auf die Zeile, die unter dem Feld angezeigt wird.
  3. Geben Sie im Feld Filter den Wert instance_id ein. Geben Sie dann die Instanz-ID ein, die Sie prüfen möchten, und klicken Sie auf Übernehmen.
  4. Klicken Sie in der Drop-down-Liste Aggregator auf max.

Es steht jetzt ein Diagramm zur Verfügung, das die CPU-Auslastung und die Latenzmesswerte für eine Cloud Spanner-Instanz anzeigt. Wenn beide Messwerte gleichzeitig höher als erwartet sind, können Sie weitere Maßnahmen ergreifen, um das Problem zu beheben.

Weitere Informationen zum Erstellen benutzerdefinierter Diagramme finden Sie in der Cloud Monitoring-Dokumentation.

Benachrichtigungen für Cloud Spanner-Messwerte erstellen

Beim Erstellen einer Cloud Spanner-Instanz wählen Sie die Anzahl der Knoten aus, die Compute-Ressourcen für die Instanz bereitstellen. Wenn sich die Arbeitslast der Instanz ändert, passt Cloud Spanner die Anzahl der Knoten in der Instanz nicht automatisch an. Daher müssen Sie mehrere Benachrichtigungen einrichten, damit die Instanz innerhalb der empfohlenen Höchstwerte für die CPU-Auslastung und des empfohlenen Limits für den Speicher pro Knoten verbleibt.

Beachten Sie für das Erstellen der empfohlenen Benachrichtigungsrichtlinien die Anleitungen und die Einstellungen der Tabelle weiter unten:

CPU mit hoher Priorität

Mit den folgenden Einstellungen können Sie eine Benachrichtigungsrichtlinie erstellen, die ausgelöst wird, wenn die Auslastung ihrer hochprioritären CPU für Cloud Spanner über einem empfohlenen Schwellenwert liegt:

Bereich Ziel
Feld

Wert
Resource type* Cloud Spanner Instance
Metric CPU Utilization by priority
Filter instance_id = YOUR_INSTANCE_ID
priority = high
Aggregator max
Period 10 m
Advanced Aggregation Aligner: mean
* Die Auswahl dieser Ressource und dieses Messwerttyps entspricht der Eingabe des folgenden Werts im Bereich Ressourcentyp und Messwert suchen: spanner.googleapis.com/instance/cpu/utilization_by_priority.
Bereich Bedingungen
Feld

Wert
Condition triggers if Any time series violates
Condition is above
Threshold 45% für multiregionale Instanzen;
65% für regionale Instanzen.
For 10 minutes

Gleitender 24-Stunden-Durchschnitt der CPU

Für eine Benachrichtigungsrichtlinie, die ausgelöst wird, wenn der gleitende 24-Stunden-Durchschnitt Ihrer CPU-Auslastung für Cloud Spanner einen empfohlenen Schwellenwert überschreitet, verwenden Sie die folgenden Einstellungen:

Bereich Ziel
Feld

Wert
Resource type* Cloud Spanner Instance
Metric Smoothed CPU utilization
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Period 10 m
Advanced Aggregation Aligner: mean
* Die Auswahl dieser Ressource und dieses Messwerttyps entspricht der Eingabe des folgenden Werts im Bereich Ressourcentyp und Messwert suchen: spanner.googleapis.com/instance/cpu/smoothed_utilization.
Bereich Bedingungen
Feld

Wert
Condition triggers if Any time series violates
Condition is above
Threshold 90%
For 10 minutes

Google Cloud Platform für Azure-Experten: Speicherung

Für eine Benachrichtigungsrichtlinie, die ausgelöst wird, wenn der Speicher für Ihre Cloud Spanner-Instanz über einem empfohlenen Schwellenwert liegt, verwenden Sie die folgenden Einstellungen:

Bereich Ziel
Feld

Wert
Resource type* Cloud Spanner Instance
Metric Storage used
Filter instance_id = YOUR_INSTANCE_ID
Aggregator sum
Period 10 m
Advanced Aggregation Aligner: max
* Die Auswahl dieser Ressource und dieses Messwerttyps entspricht der Eingabe des folgenden Werts im Bereich Ressourcentyp und Messwert suchen: spanner.googleapis.com/instance/storage/used_bytes.
Bereich Bedingungen
Feld

Wert
Condition triggers if Any time series violates
Condition is above
Threshold Legen Sie den Schwellenwert auf 75 % des maximalen Speichers pro Knoten fest, multipliziert mit der Anzahl der Knoten. Die aktuellen Knotenlimits finden Sie unter Kontingente und Limits für Cloud Spanner.

Für ein Limit von 2 TB pro Knoten lautet der empfohlene Schwellenwert

1649267441664 multipliziert mit der Anzahl der Knoten in der Instanz.
For 10 minutes

Weitere Informationen