Instanzen mit Systemstatistiken überwachen

Auf dieser Seite wird beschrieben, wie Sie das Dashboard „Systemstatistiken“ zum Überwachen von Spanner-Instanzen und ‑Datenbanken verwenden.

Systemstatistiken

Auf dem Dashboard für Systemstatistiken werden Kurzübersichten und Diagramme für eine ausgewählte Instanz oder Datenbank angezeigt. Außerdem finden Sie dort Messwerte zu Latenzen, CPU-Auslastung, Speicher, Durchsatz und anderen Leistungsstatistiken. Sie können Diagramme für verschiedene Zeiträume abrufen, die von der letzten Stunde bis zu den letzten 30 Tagen reichen.

Das Dashboard für Systemstatistiken enthält die folgenden Abschnitte (siehe Screenshot):

  1. Liste der Datenbanken: Hier werden Statistiken der ausgewählten Datenbank angezeigt. Sie können sich eine einzelne Datenbank oder eine Zusammenfassung aller Datenbanken ansehen. Diese Funktion ist nur für Instanzen verfügbar.
  2. Layout-Schaltfläche:Damit können Sie zwischen einem einspaltigen und einem zweispaltigen Layout wechseln.
  3. Zeitraumfilter: Hiermit lassen sich die Statistiken nach Zeiträumen filtern, z. B. nach Stunden, Tagen oder einem benutzerdefinierten Bereich.
  4. Kurzübersichten : Hier werden Statistiken zu einem bestimmten Zeitpunkt und für den ausgewählten Zeitraum angezeigt.
  5. Diagramme: Hier finden Sie unter anderem Diagramme zur CPU-Auslastung, zum Durchsatz, zu Latenzen und zur Speichernutzung.

    Wenn Sie in Ihrer Instanz eine Partition (in der Vorabversion) erstellen, wird eine zusätzliche Drop-down-Liste angezeigt, über die Sie Diagramme für eine einzelne Partition oder ein Aggregat aller Partitionen aufrufen können. Diese Drop-down-Liste wird nicht angezeigt, wenn Sie noch keine Partitionen erstellt haben.

Dashboard „Systemstatistiken“

Kurzübersichten, Diagramme und Messwerte zu Systeminformationen

Das Dashboard „Systeminformationen“ bietet die folgenden Diagramme und Messwerte, um den aktuellen Status und den Verlaufsstatus einer Instanz anzuzeigen. Die meisten Diagramme und Messwerte sind auf Instanzebene verfügbar. Sie können sich auch viele Diagramme und Messwerte für eine einzelne Datenbank in einer Instanz anzeigen lassen.

Verfügbare Kurzübersichten

Name Beschreibung
CPU-Auslastung Gesamte CPU-Nutzung in einer Instanz oder ausgewählten Datenbank. In einer Dual-Region- oder Multi-Region-Instanz stellt dieser Messwert den regionsübergreifenden Mittelwert der CPU-Auslastung dar.
Latenz: P99 P99-Latenzen für Lese- und Schreibvorgänge in einer Instanz oder ausgewählten Datenbank.
Latenz: P50 P50-Latenz für Lese- und Schreibvorgänge in einer Instanz oder ausgewählten Datenbank.
Durchsatz Die Menge an unkomprimierten Daten,die pro Sekunde aus der Instanz oder Datenbank gelesen oder in diese geschrieben wurden. Dieser Wert wird in binären Megabyte (MB) gemessen, wobei 1 MB 2 hoch 20 Byte entspricht. Diese Maßeinheit wird auch als Mebibyte (MiB) bezeichnet.
Vorgänge pro Sekunde Anzahl der Vorgänge pro Sekunde (Rate) bei Lese- und Schreibvorgängen in einer Instanz oder ausgewählten Datenbank.
Speicherauslastung Auf Instanzebene ist es der prozentuale Wert der gesamten Speicherauslastung innerhalb einer Instanz. Auf Datenbankebene ist dies der Gesamtspeicher, der für die ausgewählte Datenbank verwendet wird.

Verfügbare Diagramme und Messwerte

Im folgenden Diagramm sehen Sie einen Beispielmesswert:

Image

Die Symbolleiste jeder Diagrammkarte enthält folgende Standardoptionen:

  • Wenn Sie einen bestimmten Bereich eines Diagramms heranzoomen möchten, klicken Sie auf das Diagramm und ziehen Sie es horizontal oder vertikal. Klicken Sie auf Zoom zurücksetzen, um den Zoomvorgang rückgängig zu machen. Zoomvorgänge werden gleichzeitig auf alle Diagramme im Dashboard angewendet.

  • Klicken Sie auf Diagrammlegende ein-/ausblenden, um die Legende auszublenden oder anzuzeigen.

  • Klicken Sie auf Vollbildmodus aktivieren/beenden, um ein Diagramm im Vollbildmodus anzuzeigen. Sie können den Vollbildmodus auch beenden, indem Sie auf die Taste Esc klicken.

  • Klicken Sie auf Weitere Diagrammoptionen, um weitere Optionen aufzurufen.

    Die meisten Diagramme bieten diese Optionen:

    • PNG-Bild herunterladen.
    • CSV-Datei herunterladen
    • Zum benutzerdefinierten Dashboard hinzufügen Mit dieser Option können Sie einem neuen oder vorhandenen Dashboard in Cloud Monitoring ein Diagramm hinzufügen.
    • In Metrics Explorer ansehen. Sehen Sie sich den Messwert im Metrics Explorer an. Sie können sich weitere Spanner-Messwerte im Metrics Explorer ansehen, nachdem Sie den Ressourcentyp Spanner-Datenbank ausgewählt haben.

In der folgenden Tabelle werden die Diagramme beschrieben, die standardmäßig im Systemstatistik-Dashboard angezeigt werden. Für jedes Diagramm ist der Messwerttyp aufgeführt. Die Messwerttyp-Strings folgen diesem Präfix: spanner.googleapis.com/. Der Messwerttyp beschreibt Messungen, die von einer überwachten Ressource erfasst werden können.

Diagrammname und Messwerttyp
Beschreibung Für Instanzen verfügbar Verfügbar für Datenbanken

CPU-Auslastung nach Priorität


instance/cpu/utilization_by_priority

Der Prozentsatz der CPU-Ressourcen der Instanz für Aufgaben mit hoher, mittlerer, niedriger oder aller Prioritäten. Dazu gehören von Ihnen initiierte Anfragen und Wartungsaufgaben, die Spanner umgehend ausführen muss.

Bei dual- oder multiregionalen Instanzen werden Messwerte nach Region und Priorität gruppiert.

Weitere Informationen zu Aufgaben mit hoher Priorität
Weitere Informationen zur CPU-Auslastung



CPU-Auslastung insgesamt


instance/cpu/utilization_by_priority

Die gesamte CPU-Auslastung als Prozentsatz der CPU-Ressourcen der Instanz.

Bei Instanzen können Sie sich das gestapelte Diagramm der gesamten CPU-Auslastung nach Datenbank oder nach einer Kombination aus Aufgabentyp (Nutzer/System) und Priorität ansehen.

Für Datenbanken können Sie sich das gestapelte Diagramm der gesamten CPU-Auslastung nach Kombination aus Aufgabentyp (Nutzer/System) und Priorität ansehen.

Bei Dual- oder Multiregion-Instanzen können Sie die Region auswählen, die angezeigt werden soll, oder alle Regionen als mehrere Liniendiagramme anzeigen.



CPU-Auslastung nach Vorgangstyp


instance/cpu/utilization_by_operation_type

Ein gestapeltes Diagramm der CPU-Auslastung als Prozentsatz der CPU-Ressourcen der Instanz, gruppiert nach vom Nutzer initiierten Vorgängen wie Lese-, Schreib- und Commit-Vorgängen. Mit diesem Messwert erhalten Sie eine detaillierte Aufschlüsselung der CPU-Auslastung und können weitere Schritte zur Fehlerbehebung ausführen, wie unter Hohe CPU-Auslastung untersuchen beschrieben.

Über das Drop-down-Menü Priorität können Sie die Aufgaben nach Priorität filtern.

Bei dual-regionalen oder multiregionalen Instanzen zeigen die Messwerte im Liniendiagramm den durchschnittlichen Prozentsatz der Regionen an.



CPU-Auslastung (gleitender Durchschnitt über 24 Stunden)


instance/cpu/smoothed_utilization

Ein gleitender Durchschnitt der gesamten CPU-Spanner-Auslastung als Prozentsatz der CPU-Ressourcen der Instanz für jede Datenbank. Jeder Datenpunkt ist ein Durchschnittswert für die letzten 24 Stunden.

Bei Instanzen mit zwei oder mehreren Regionen können Sie Messwerte im Liniendiagramm über das Drop-down-Menü Region nach Region filtern.



Latenz nach Änderungsstream lesen


api/read_request_latencies_by_change_stream

Die Verteilung der Latenzen von Leseanfragen nach Änderungsstream. Mit diesem Messwert können Sie alle Latenzen sehen und unterscheiden, ob eine Latenz für eine Lesevorgang aus einem Änderungsstream oder einem anderen Stream ist.

Änderungsstreamabfragen dauern lange und sollten mehrere Sekunden in Anspruch nehmen. Im Gegensatz dazu sind Abfragen ohne Änderungsstream in der Regel kurz. Mit diesem Messwert können Sie Folgendes tun:
  • Latenzen für Abfragen des Änderungsstreams ansehen
  • Latenzen für Abfragen ohne Änderungsstream ansehen
  • Prüfen, ob bei einer Abfrage ohne Änderungsstream eine hohe Latenz auftritt



CPU-Nutzung des Spitzen-Splits


instance/peak_split_peak
Die maximale CPU-Auslastung, die in allen Splits einer Datenbank beobachtet wurde. Dieser Messwert gibt den Prozentsatz der Ressourcen der CPU an, die für einen Split verwendet werden. Ein Prozentsatz von über 50% ist ein aktiver Split. Das bedeutet, dass der Split die Hälfte der Verarbeitungseinheitsressourcen des Hostservers nutzt. Ein Wert von 100% bedeutet, dass der Split den Großteil der Ressourcen der Prozesseinheit des Hostservers nutzt. Spanner verwendet eine lastbasierte Aufteilung, um Hotspots zu beheben und die Last auszugleichen. Aufgrund problematischer Muster in der Anwendung kann Spanner die Last jedoch möglicherweise nicht ausgleichen, selbst nach mehreren Aufteilungsversuchen. Bei Hotspots, die mindestens 10 Minuten andauern, sind daher möglicherweise weitere Schritte zur Fehlerbehebung und möglicherweise auch Änderungen an der Anwendung erforderlich. Weitere Informationen finden Sie unter Hotspots in Aufteilungen finden.


Latenz


api/request_latencies

Die Zeit, die Spanner für die Bearbeitung einer Lese- oder Schreibanfrage benötigt hat. Wählen Sie im Drop-down-Menü Funktion die Option Lesen oder Schreiben aus oder Lesen/Schreiben, um Messwerte für beide Optionen zu sehen. Diese Messung beginnt, wenn Spanner eine Anfrage empfängt, und endet, wenn Spanner mit dem Senden einer Antwort beginnt.

Im Drop-down-Menü Perzentil können Sie sich Latenzmesswerte für die Latenz des 50. und 99. Perzentils anzeigen lassen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50% aller Anfragen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99% aller Anfragen.



Latenz nach Datenbank


api/request_latencies

Die Zeit, die Spanner für die Bearbeitung einer Lese- oder Schreibanfrage benötigt hat, gruppiert nach Datenbank. Wählen Sie im Drop-down-Menü Funktion die Option Lesen oder Schreiben aus oder Lesen/Schreiben, um Messwerte für beide Optionen zu sehen. Diese Messung beginnt, wenn Spanner eine Anfrage empfängt, und endet, wenn Spanner mit dem Senden einer Antwort beginnt.

Über das Drop-down-Menü Perzentil können Sie sich Messwerte für die Latenz des 50. und 99. Perzentils anzeigen lassen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50% aller Anfragen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99% aller Anfragen.



Latenz nach API-Methode


api/request_latencies

Die Zeit, die Spanner für die Bearbeitung einer Anfrage benötigt hat, gruppiert nach Spanner API-Methoden. Diese Messung beginnt, wenn Spanner eine Anfrage empfängt, und endet, wenn Spanner mit dem Senden einer Antwort beginnt.

Über das Drop-down-Menü Perzentil können Sie sich Messwerte für die Latenz des 50. und 99. Perzentils ansehen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50% aller Anfragen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99% aller Anfragen.




Transaktionslatenz


api/request_latencies_by_transaction_type

Die Zeit, die Spanner für die Verarbeitung einer Transaktion benötigt hat. Sie können Messwerte für Lese-Schreib- und schreibgeschützte Transaktionen anzeigen lassen.

Der Hauptunterschied zwischen dem Diagramm „Latenz“ und dem Diagramm „Transaktionslatenz“ besteht darin, dass Sie im Diagramm „Transaktionslatenz“ die Beteiligung des Leaders für den schreibgeschützten Typ auswählen können. Sie können für die schreibgeschützte Transaktion Leiter ist beteiligt oder Leiter ist nicht beteiligt auswählen. Bei Lesevorgängen, die den Leiter betreffen, kann es zu einer höheren Latenz kommen. Anhand dieses Diagramms können Sie prüfen, ob Sie veraltete Lesevorgänge verwenden sollten, ohne mit dem Leader zu kommunizieren, vorausgesetzt, die Zeitstempelgrenze beträgt mindestens 15 Sekunden. Bei Lese-Schreib-Transaktionen ist der Leader immer an der Transaktion beteiligt. Die im Diagramm angezeigten Daten enthalten daher immer die Zeit, die vergangen ist, bis die Anfrage den Leader erreicht und eine Antwort erhalten hat.

Sie können sich Messwerte für die Latenz des 50. und 99. Perzentils ansehen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50% aller Transaktionen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99% aller Transaktionen.



Transaktionslatenz nach Datenbank


api/request_latencies_by_transaction_type

Die Zeit, die Spanner für die Verarbeitung einer Transaktion benötigt hat. Sie können Messwerte für Lese-Schreib- und schreibgeschützte Transaktionen anzeigen lassen.

Der Hauptunterschied zwischen dem Diagramm „Latenz“ und dem Diagramm „Transaktionslatenz nach Datenbank“ besteht darin, dass Sie im Diagramm „Transaktionslatenz nach Datenbank“ die Führungsrolle für den schreibgeschützten Typ auswählen können. Sie können für die schreibgeschützte Transaktion Leiter ist beteiligt oder Kein Leiter ist beteiligt auswählen. Bei Lesezugriffen, die den Leiter betreffen, kann es zu einer höheren Latenz kommen. Anhand dieses Diagramms können Sie prüfen, ob Sie veraltete Lesevorgänge verwenden sollten, ohne mit dem Leader zu kommunizieren, vorausgesetzt, die Zeitstempelgrenze beträgt mindestens 15 Sekunden. Bei Lese-Schreib-Transaktionen ist der Leader immer an der Transaktion beteiligt. Daher enthalten die im Diagramm angezeigten Daten immer die Zeit, die vergangen ist, bis die Anfrage den Leader erreicht und eine Antwort erhalten hat.

Sie können sich Messwerte für die Latenz des 50. und 99. Perzentils ansehen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50% aller Transaktionen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99% aller Transaktionen.




Transaktionslatenz nach API-Methode


api/request_latencies_by_transaction_type

Die Zeit, die Spanner für die Verarbeitung einer Transaktion benötigt hat. Sie können Messwerte für Lese-Schreib- und schreibgeschützte Transaktionen anzeigen lassen.

Der Hauptunterschied zwischen dem Diagramm „Latenz“ und dem Diagramm „Transaktionslatenz nach API-Methode“ besteht darin, dass Sie im Diagramm „Transaktionslatenz nach API-Methode“ die Führungsrolle für den schreibgeschützten Typ auswählen können. Sie können für die schreibgeschützte Transaktion Leiter ist beteiligt oder Kein Leiter ist beteiligt auswählen. Bei Lesezugriffen, die den Leader betreffen, kann es zu einer höheren Latenz kommen. Anhand dieses Diagramms können Sie beurteilen, ob Sie veraltete Lesevorgänge verwenden sollten, ohne mit dem Leader zu kommunizieren, vorausgesetzt, die Zeitstempelgrenze beträgt mindestens 15 Sekunden. Bei Lese-Schreib-Transaktionen ist der Leader immer an der Transaktion beteiligt. Daher enthalten die im Diagramm angezeigten Daten immer die Zeit, die vergangen ist, bis die Anfrage den Leader erreicht und eine Antwort erhalten hat.

Sie können sich Messwerte für die Latenz des 50. und 99. Perzentils anzeigen lassen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50% aller Transaktionen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99% aller Transaktionen.



Vorgänge pro Sekunde


api/api_request_count

Die Anzahl der Lese-/Schreibvorgänge, die Spanner pro Sekunde ausgeführt hat, oder die Anzahl der Fehler, die auf dem Spanner-Server pro Sekunde aufgetreten sind.

Sie können auswählen, welche Vorgänge in dieser Tabelle angezeigt werden sollen:
  • Lese- und Schreibvorgänge (einschließlich Lese- und Schreibfehler)
  • Nur Lesevorgänge (einschließlich DML-Anweisungen und Lesefehler)
  • Nur Schreibvorgänge (ausschließlich DML-Anweisungen und Schreibfehler)
  • Fehler auf dem Spanner-Server (nach Lese- und Schreibvorgang gruppiert)



Vorgänge pro Sekunde nach Datenbank


api/api_request_count

Die Anzahl der Lese-/Schreibvorgänge, die Spanner pro Sekunde ausgeführt hat, oder die Anzahl der Fehler, die auf dem Spanner-Server pro Sekunde aufgetreten sind. Dieses Diagramm ist nach Datenbank gruppiert.

Sie können auswählen, welche Vorgänge in dieser Tabelle angezeigt werden sollen:
  • Lese- und Schreibvorgänge (einschließlich Lese- und Schreibfehler)
  • Nur Lesevorgänge (einschließlich DML-Anweisungen und Lesefehler)
  • Nur Schreibvorgänge (ausschließlich DML-Anweisungen und Schreibfehler)
  • Fehler auf dem Spanner-Server (nach Lese- und Schreibvorgang gruppiert)



Vorgänge pro Sekunde nach API-Methode


api/api_request_count

Die Anzahl der Vorgänge, die Spanner pro Sekunde ausgeführt hat, gruppiert nach Spanner API-Methode



Durchsatz


api/sent_bytes_count (Lesen)

api/received_bytes_count (Schreiben)

Die Menge an unkomprimierten Daten, die pro Sekunde aus der Instanz oder Datenbank gelesen oder in diese geschrieben wurden. Dieser Wert wird in binären Byte-Einheiten gemessen. Diese Maßeinheit basiert auf der Potenz von 2. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.

Der Durchsatz für Lesevorgänge umfasst Anfragen und Antworten für Methoden in der Lese-API und für SQL-Abfragen. Auch Anfragen und Antworten für DML-Anweisungen sind darin enthalten.

Der Durchsatz für Schreibvorgänge umfasst Anfragen und Antworten zum Aktualisieren von Daten über die Mutation API. Anfragen und Antworten für DML-Anweisungen sind darin enthalten.



Durchsatz nach Datenbank


api/sent_bytes_count (Lesen)

api/received_bytes_count (Schreiben)

Die Menge an unkomprimierten Daten, die pro Sekunde aus der Instanz oder Datenbank gelesen oder in diese geschrieben wurden, gruppiert nach Datenbank. Dieser Wert wird in binären Byte-Einheiten gemessen. Diese Maßeinheit basiert auf der Potenz von 2. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.

Der Durchsatz für Lesevorgänge umfasst Anfragen und Antworten für Methoden in der Lese-API und für SQL-Abfragen. Auch Anfragen und Antworten für DML-Anweisungen sind darin enthalten.

Der Durchsatz für Schreibvorgänge umfasst Anfragen und Antworten zum Aktualisieren von Daten über die Mutation API. Anfragen und Antworten für DML-Anweisungen sind darin enthalten.



Durchsatz nach API-Methode


api/sent_bytes_count (Lesen)

api/received_bytes_count (Schreiben)

Die Menge an unkomprimierten Daten, die pro Sekunde aus der Instanz oder Datenbank gelesen oder in diese geschrieben wurden, gruppiert nach API-Methode. Dieser Wert wird in binären Byte-Einheiten gemessen. Diese Maßeinheit basiert auf der Potenz von 2. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.

Der Durchsatz für Lesevorgänge umfasst Anfragen und Antworten für Methoden in der Lese-API und für SQL-Abfragen. Auch Anfragen und Antworten für DML-Anweisungen sind darin enthalten.

Der Schreibdurchsatz umfasst Anfragen und Antworten zum Aktualisieren von Daten über die Mutation API. Anfragen und Antworten für DML-Anweisungen sind darin enthalten.



Gesamtspeicherplatz


instance/storage/used_bytes

Die Datenmenge, die in der Instanz oder Datenbank gespeichert ist. Dieser Wert wird in binären Byte-Einheiten gemessen. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.



Gesamtdatenbankspeicher nach Datenbank


instance/storage/used_bytes

Die Datenmenge, die in der Instanz oder Datenbank gespeichert ist, gruppiert nach Datenbank. Dieser Wert wird in binären Byte-Einheiten gemessen. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.



Datenbankspeicher nach Tabelle


(kein)

Die Datenmenge, die in der Instanz oder Datenbank gespeichert ist, gruppiert nach Tabellen in der ausgewählten Datenbank. Dieser Wert wird in binären Byte-Einheiten gemessen. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.

Für dieses Diagramm werden Daten durch Abfragen von SPANNER_SYS.TABLE_SIZES_STATS_1HOUR abgerufen. Weitere Informationen finden Sie unter Statistiken zur Tabellengröße.



Am häufigsten verwendete Tabellen nach Vorgängen


(keine)

Die 15 am häufigsten verwendeten Tabellen und Indexe in der Instanz oder Datenbank, bestimmt anhand der Anzahl der Lese-, Schreib- oder Löschvorgänge.
Die Daten für dieses Diagramm werden durch Abfragen der Statistiktabellen für Tabellenvorgänge abgerufen. Weitere Informationen finden Sie unter Tabellenvorgangsstatistiken.



Am seltensten verwendete Tabellen nach Vorgängen


(keine)

Die 15 am seltensten verwendeten Tabellen und Indexe in der Instanz oder Datenbank, bestimmt anhand der Anzahl der Lese-, Schreib- oder Löschvorgänge.
Die Daten für dieses Diagramm werden durch Abfragen der Statistiktabellen für Tabellenvorgänge abgerufen. Weitere Informationen finden Sie unter Tabellenvorgangsstatistiken.



Wartezeit für Sperren


lock_stat/total/lock_wait_time

Die Sperrwartezeit für eine Transaktion ist die Zeit, die benötigt wird, um eine Sperre für eine Ressource zu erwerben, die von einer anderen Transaktion gehalten wird.

Die Gesamtwartezeit für Sperrungen bei Sperrkennungen wird für die gesamte Datenbank aufgezeichnet.



Wartezeit bei Sperren nach Datenbank


lock_stat/total/lock_wait_time

Die Sperrwartezeit für eine Transaktion ist die Zeit, die benötigt wird, um eine Sperre für eine Ressource zu erwerben, die von einer anderen Transaktion gehalten wird.

Die Gesamtwartezeit für Sperrungen bei Sperrkennungen wird für die gesamte Datenbank aufgezeichnet.



Gesamtspeicherplatz für Sicherungen


instance/backup/used_bytes

Die Datenmenge, die in den Sicherungen gespeichert ist, die der Instanz oder Datenbank zugeordnet ist. Dieser Wert wird in binären Byte-Einheiten gemessen. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.



Gesamtspeicherplatz für Sicherungen nach Datenbank


instance/backup/used_bytes

Die Datenmenge, die in den Sicherungen gespeichert ist, die der Instanz oder Datenbank zugeordnet ist, gruppiert nach Datenbank. Dieser Wert wird in binären Byte-Einheiten gemessen. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.



Rechenkapazität


instance/processing_units
instance/nodes

Die Rechenkapazität ist die Anzahl der Verarbeitungseinheiten oder Knoten, die in einer Instanz verfügbar sind. Sie können die Kapazität in Verarbeitungseinheiten oder in Knoten anzeigen.




Leader-Verteilung


instance/leader_percentage_by_region

Bei biregionalen oder multiregionalen Instanzen können Sie die Anzahl der Datenbanken mit der Mehrheit der Leader (>=50%) in einer bestimmten Region aufrufen. Wenn Sie im Drop-down-Menü Regionen eine bestimmte Region auswählen, wird im Diagramm die Gesamtzahl der Datenbanken in dieser Instanz angezeigt, für die die ausgewählte Region die Hauptregion ist. Wenn Sie im Drop-down-Menü Regionen die Option Alle Regionen auswählen, wird im Diagramm für jede Region eine Linie angezeigt. Jede Linie zeigt die Gesamtzahl der Datenbanken in der Instanz an, für die diese Region die Hauptregion ist.

Bei Datenbanken in einer biregionalen oder multiregionalen Instanz können Sie den Prozentsatz der nach Region gruppierten Leader aufrufen. Wenn eine Datenbank beispielsweise zu einem bestimmten Zeitpunkt fünf Spitzenreiter hat, einen in us-west1 und vier in us-east1, werden im Diagramm „Alle Regionen“ zwei Linien (eine pro Region) angezeigt. Eine Linie für us-west1 liegt bei 20 % und die andere Linie für us-east1 bei 80%. Das Diagramm für us-west1 enthält eine einzelne Linie bei 20 % und das Diagramm für us-east1 eine einzelne Linie bei 80%.

Hinweis: Wenn eine Datenbank vor Kurzem erstellt oder eine Leitregion vor Kurzem geändert wurde, stabilisieren sich die Diagramme möglicherweise nicht sofort.

Dieses Diagramm ist nur für dual-regionale und multiregionale Instanzen verfügbar.




Biregionale Zeitachse zur Quorumintegrität


instance/dual_region_quorum_availability

Dieses Diagramm ist nur für Instanzkonfigurationen mit zwei Regionen verfügbar. Sie zeigt den Status von drei Quorums: das Quorum für zwei Regionen (Global) und das Quorum für eine einzelne Region in jeder Region (z. B. Sydney und Melbourne).

Wenn es zu einer Dienstunterbrechung kommt, wird in der Zeitachse eine orangefarbene Leiste angezeigt. Wenn Sie den Mauszeiger auf den Balken bewegen, sehen Sie die Start- und Endzeit der Unterbrechung. Verwenden Sie dieses Diagramm zusammen mit den Fehlerraten- und Latenzmesswerten, um bei regionalen Ausfällen selbstverwaltete Entscheidungen zum Zeitpunkt des Failovers zu treffen. Weitere Informationen finden Sie unter Failover und Failback.

Informationen zum manuellen Failover und Failback finden Sie unter Quorum für Dual-Region-Speicher ändern.




Anzahl der Remote-Dienstaufrufe


query_stat/total/remote_service_calls_count

Anzahl der Remote-Dienstaufrufe, gruppiert nach Dienst- und Antwortcode.

Antwortet mit einem HTTP-Antwortcode wie 200 oder 500.




Latenzen der Remote-Dienstaufrufe


query_stat/total/remote_service_calls_latencies

Die Latenz der Remote-Dienstaufrufe, gruppiert nach Dienst.

Im Drop-down-Menü „Perzentil“ können Sie sich Latenzmesswerte für die Latenz des 50. und 99. Perzentils anzeigen lassen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50 % aller Anfragen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99 % aller Anfragen.




Anzahl der vom Remote-Dienst verarbeiteten Zeilen


query_stat/total/remote_service_processed_rows_count

Anzahl der Zeilen, die von einem Remote-Dienst verarbeitet wurden, gruppiert nach Dienstleister und Antwortcode.

Antwortet mit einem HTTP-Antwortcode wie 200 oder 500.




Latenzen der vom Remote-Dienst verarbeiteten Zeilen


query_stat/total/remote_service_processed_rows_latencies

Anzahl der Zeilen, die von einem Remote-Dienst verarbeitet wurden, gruppiert nach Dienst und Antwortcode.

Im Drop-down-Menü „Perzentil“ können Sie sich Latenzmesswerte für die Latenz des 50. und 99. Perzentils anzeigen lassen:
  • Latenz des 50. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 50 % aller Anfragen.
  • Latenz des 99. Perzentils: Die maximale Latenz in Sekunden für die schnellsten 99 % aller Anfragen.




Netzwerkbyte des Remote-Dienstes


query_stat/total/remote_service_network_bytes_sizes

Mit dem Remote-Dienst ausgetauschte Netzwerkbyte, gruppiert nach Dienst und Richtung.

Dieser Wert wird in binären Byte-Einheiten gemessen. Diese Maßeinheit basiert auf der Potenz 2. Beispiel: 1 binäres Gigabyte (GB) entspricht 2 hoch 30 Byte. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.

Die Richtung bezieht sich auf gesendeten oder empfangenen Traffic.

Im Drop-down-Menü „Perzentil“ können Sie sich Messwerte für den 50. und 99. Perzentil des Netzwerkbyte-Austauschs ansehen:
  • 50. Perzentil: Die ausgetauschten Daten im 50. Perzentil der Anfragen.
  • 99. Perzentil: Die ausgetauschten Daten im 99. Perzentil der Anfragen.


Diagramme und Messwerte für verwaltetes Autoscaling

Wenn für eine Instanz ein verwalteter Autoscaler aktiviert ist, enthält das Diagramm zur Rechenkapazität zusätzlich zu den Optionen im vorherigen Abschnitt die Schaltfläche Protokolle ansehen. Wenn Sie auf diese Schaltfläche klicken, werden Logs vom verwalteten Autoscaler angezeigt.

Die folgenden Messwerte sind für Instanzen verfügbar, für die der verwaltete Autoscaler aktiviert ist.

Diagrammname und Messwerttyp Beschreibung
Rechenkapazität Mit ausgewählten Knoten

instance/autoscaling/min_node_count

Mindestanzahl der Knoten, die dem Autoscaling konfiguriert ist, um sie der Instanz zuzuweisen.

instance/autoscaling/max_node_count
Die maximale Anzahl von Knoten, die dem Autoscaler für die Instanz zugewiesen werden soll.

instance/autoscaling/recommended_node_count_for_cpu

Empfohlene Anzahl von Knoten basierend auf der CPU-Auslastung der Instanz.

instance/autoscaling/recommended_node_count_for_storage

Empfohlene Anzahl von Knoten basierend auf der Speichernutzung der Instanz.
Rechenkapazität Mit ausgewählten Verarbeitungseinheiten

instance/autoscaling/min_processing_units

Mindestanzahl der Verarbeitungseinheiten, die dem Autoscaling konfiguriert ist, um sie der Instanz zuzuweisen.

instance/autoscaling/max_processing_units

Maximale Anzahl von Verarbeitungseinheiten, die dem Autoscaler für die Instanz zugewiesen werden.

instance/autoscaling/recommended_processing_units_for_cpu

Empfohlene Anzahl von Verarbeitungseinheiten. Diese Empfehlung basiert auf der bisherigen CPU-Auslastung der Instanz.

instance/autoscaling/recommended_processing_units_for_storage

Empfohlene Anzahl der zu verwendenden Verarbeitungseinheiten. Diese Empfehlung basiert auf der bisherigen Speichernutzung der Instanz.
CPU-Auslastung nach Priorität

instance/autoscaling/high_priority_cpu_utilization_target

CPU-Auslastungsziel mit hoher Priorität, das für das Autoscaling verwendet werden soll.
Gesamtspeicherplatz Mit ausgewählten Verarbeitungseinheiten

instance/storage/limit_bytes

Speicherlimit für die Instanz in Byte.

instance/autoscaling/storage_utilization_target

Speicherauslastungsziel, das für das Autoscaling verwendet werden soll.

Datenaufbewahrung

Die maximale Datenaufbewahrung für die meisten Messwerte im Dashboard „Systemstatistiken“ beträgt sechs Wochen. Für das Diagramm Datenbankspeicherplatz nach Tabelle werden die Daten jedoch aus der Tabelle SPANNER_SYS.TABLE_SIZES_STATS_1HOUR (anstelle von Spanner) verwendet, die eine maximale Aufbewahrungsdauer von 30 Tagen hat. Weitere Informationen finden Sie unter Datenaufbewahrung.

Systemstatistik-Dashboard aufrufen

Zum Aufrufen der Seite „Systemstatistiken“ benötigen Sie zusätzlich zu den Spanner-Berechtigungen und Spanner-Berechtigungen auf Instanz- und Datenbankebene die folgenden IAM-Berechtigungen (Identity and Access Management):

  • spanner.databases.beginReadOnlyTransaction
  • spanner.databases.select
  • spanner.sessions.create

Weitere Informationen zu IAM-Berechtigungen für Spanner finden Sie unter Zugriffssteuerung mit IAM.

Wenn Sie den verwalteten Autoscaler für Ihre Instanz aktivieren, benötigen Sie außerdem die Berechtigung logging.logEntries.list, um die Logs des verwalteten Autoscalers aufzurufen.

Weitere Informationen zu dieser Berechtigung finden Sie unter Vordefinierte Rollen.

So rufen Sie das Systemstatistik-Dashboard auf:

  1. Öffnen Sie in der Google Cloud -Console die Liste der Spanner-Instanzen.

    Instanzliste öffnen

  2. Führen Sie einen der folgenden Schritte aus:

    1. Wenn Sie Messwerte für eine Instanz aufrufen möchten, klicken Sie auf den Namen der Instanz und dann im Navigationsmenü auf Systemstatistiken.

    2. Wenn Sie Messwerte für eine Datenbank aufrufen möchten, klicken Sie auf den Namen der Instanz, wählen Sie eine Datenbank aus und klicken Sie dann im Navigationsmenü auf Systemstatistiken.

  3. Optional: Sie können sich auch Verlaufsdaten für einen anderen Zeitraum anzeigen lassen. Suchen Sie die Schaltflächen oben rechts auf der Seite und klicken Sie dann auf den Zeitraum, den Sie sich anzeigen lassen möchten.

  4. Optional: Klicken Sie auf eine der Drop-down-Listen im Diagramm, um einzustellen, welche Daten im Diagramm angezeigt werden. Wenn die Instanz beispielsweise eine Dual-Region- oder Multi-Region-Konfiguration verwendet, bieten einige Diagramme eine Drop-down-Liste an, um sich Daten für eine bestimmte Region anzeigen zu lassen. Nicht alle Diagramme haben Drop-down-Listen.

Nächste Schritte