Diese Seite wurde von der Cloud Translation API übersetzt.

Abfragestatistiken

Spanner bietet integrierte Tabellen, in denen viele Statistiken für die CPU-intensivsten Abfragen und DML-Anweisungen (Data Manipulation Language) sowie alle Abfragen insgesamt (einschließlich Änderungsstream-Abfragen) zusammengefasst werden.

Auf Abfragestatistiken zugreifen

Spanner stellt die Abfragestatistiken im Schema SPANNER_SYS bereit. Sie haben folgende Möglichkeiten, auf SPANNER_SYS-Daten zuzugreifen:

Die Spanner Studio-Seite einer Datenbank in der Google Cloud Console.
Mit dem Befehl gcloud spanner databases execute-sql.
Query Insights-Dashboards
Die Methode executeSql oder executeStreamingSql.

Die folgenden von Spanner bereitgestellten Einzellesemethoden unterstützen SPANNER_SYS nicht:

Starken Lesevorgang aus einer einzelnen Zeile oder mehreren Zeilen in einer Tabelle durchführen
Veralteten Lesevorgang aus einer einzelnen Zeile oder mehreren Zeilen in einer Tabelle durchführen
Aus einer einzelnen Zeile oder mehreren Zeilen in einem sekundären Index lesen

Weitere Informationen finden Sie unter Methoden für einzelne Lesevorgänge.

Nach Abfrage gruppierte CPU-Nutzung

In den folgenden Tabellen werden die Abfragen mit der höchsten CPU-Auslastung während eines bestimmten Zeitraums nachverfolgt:

SPANNER_SYS.QUERY_STATS_TOP_MINUTE: Abfragen in Intervallen von 1 Minute
SPANNER_SYS.QUERY_STATS_TOP_10MINUTE: Abfragen in Intervallen von 10 Minuten
SPANNER_SYS.QUERY_STATS_TOP_HOUR: Abfragen in Intervallen von 1 Stunde

Diese Tabellen haben folgende Attribute:

Jede Tabelle enthält Daten für nicht überlappende Zeitintervalle in der Länge, die der Tabellenname festlegt.
Die Intervalle beziehen sich auf die Uhrzeit. 1-Minuten-Intervalle enden nach einer vollen Minute, 10-Minuten-Intervalle enden alle 10 Minuten ab Beginn der vollen Stunde, 1-Stunden-Intervalle enden zu jeder vollen Stunde.

Beispielsweise sind die neuesten, für SQL-Abfragen verfügbaren Intervalle um 11:59:30 Uhr:
- 1 Minute: 11:58:00–11:58:59 Uhr
- 10 Minuten: 11:40:00–11:49:59 Uhr
- 1 Stunde: 10:00:00–10:59:59 Uhr
Spanner gruppiert die Statistiken nach dem Text der SQL-Abfrage. Verwendet eine Abfrage Abfrageparameter, gruppiert Spanner alle Ausführungen der Abfrage in einer Zeile. Wenn die Abfrage String-Literale verwendet, gruppiert Spanner die Statistiken nur, wenn der vollständige Abfragetext identisch ist. Wenn sich der Text unterscheidet, wird jede Abfrage als separate Zeile angezeigt. Bei Batch-DML normalisiert Spanner den Batch, indem aufeinanderfolgende identische Anweisungen vor dem Generieren des Fingerabdrucks dedupliziert werden.
Wenn ein Anfrage-Tag vorhanden ist, ist FPRINT der Hash des Anfrage-Tags. Andernfalls ist es der Hash des TEXT-Werts. Bei partitionierten DMLs ist FPRINT immer der Hash des TEXT-Werts.
Jede Zeile enthält Statistiken für alle Ausführungen einer bestimmten SQL-Abfrage, für die Spanner während des angegebenen Intervalls Statistiken erfasst.
Wenn Spanner nicht alle Abfragen speichern kann, die während des Intervalls ausgeführt werden, priorisiert das System Abfragen mit der höchsten CPU-Auslastung im angegebenen Intervall.
Verfolgte Abfragen umfassen Abfragen, die abgeschlossen, fehlgeschlagen oder vom Nutzer abgebrochen wurden.
Eine Teilmenge der Statistiken bezieht sich auf Abfragen, die ausgeführt, aber nicht abgeschlossen wurden:
- Ausführungsanzahl und durchschnittliche Latenz in Sekunden für alle Abfragen, die nicht erfolgreich waren.
- Ausführungsanzahl für Abfragen, die zu einer Zeitüberschreitung geführt haben.
- Ausführungsanzahl für Abfragen, die vom Nutzer abgebrochen oder aufgrund von Problemen mit der Netzwerkverbindung fehlgeschlagen sind.
Alle Spalten in den Tabellen sind nullable.

Statistiken für zuvor ausgeführte partitionierte DML-Anweisungen haben die folgenden Eigenschaften:

Jede erfolgreiche partitionierte DML-Anweisung zählt als eine Ausführung. Eine partitionierte DML-Anweisung, die fehlgeschlagen oder abgebrochen wurde oder gerade ausgeführt wird, hat eine Ausführungsanzahl von null.
Statistiken für ALL_FAILED_EXECUTION_COUNT, ALL_FAILED_AVG_LATENCY_SECONDS, CANCELLED_OR_DISCONNECTED_EXECUTION_COUNT und TIMED_OUT_EXECUTION_COUNT werden für partitionierte DML-Anweisungen nicht erfasst.
Die Statistiken für jede zuvor ausgeführte partitionierte DML-Anweisung werden möglicherweise in verschiedenen Intervallen angezeigt. SPANNER_SYS.QUERY_STATS_TOP_10MINUTE und SPANNER_SYS.QUERY_STATS_TOP_HOUR bieten eine aggregierte Ansicht für partitionierte DML-Anweisungen, die innerhalb von 10 Minuten bzw. 1 Stunde abgeschlossen werden. Wenn Sie Statistiken für Anweisungen mit einer Dauer von mehr als einer Stunde aufrufen möchten, sehen Sie sich das Abfragebeispiel an.

Tabellenschema

Spaltenname	Typ	Beschreibung
`INTERVAL_END`	`TIMESTAMP`	Ende des Zeitintervalls, in dem die eingeschlossene Abfrage ausgeführt wurde
`REQUEST_TAG`	`STRING`	Das optionale Anfrage-Tag für diesen Abfragevorgang. Weitere Informationen zur Verwendung von Tags finden Sie unter Fehlerbehebung bei Anfrage-Tags.
`QUERY_TYPE`	`STRING`	Gibt an, ob eine Anfrage eine `PARTITIONED_QUERY` oder `QUERY` ist. Eine `PARTITIONED_QUERY` ist eine Abfrage mit einer `partitionToken`, die über die `PartitionQuery` API abgerufen wurde, oder eine partitionierte DML-Anweisung. Alle anderen Abfragen und DML-Anweisungen werden durch den Abfragetyp `QUERY` gekennzeichnet.
`TEXT`	`STRING`	SQL-Abfragetext, verkürzt auf ca. 64 KB Statistiken für mehrere Abfragen, die denselben Tag-String haben, werden in einer einzelnen Zeile gruppiert, wobei `REQUEST_TAG` mit diesem Tag-String übereinstimmt. In diesem Feld wird nur der Text einer dieser Abfragen angezeigt, verkürzt auf ca. 64 KB. Bei Batch-DML wird die Gruppe von SQL-Anweisungen in einer einzelnen Zeile zusammengefasst und mit einem Semikolon getrennt. Aufeinanderfolgende identische SQL-Texte werden vor dem Kürzen dedupliziert.
`TEXT_TRUNCATED`	`BOOL`	Ob der Abfragetext gekürzt wurde oder vollständig ist
`TEXT_FINGERPRINT`	`INT64`	Der Hash des Werts `REQUEST_TAG`, falls vorhanden; andernfalls der Hash des Werts `TEXT`. Entspricht dem Feld `query_fingerprint` im Audit-Log
`EXECUTION_COUNT`	`INT64`	Anzahl der von Spanner während des Intervalls registrierten Ausführungen einer Anfrage
`AVG_LATENCY_SECONDS`	`FLOAT64`	Durchschnittliche Zeit in Sekunden für jede Abfrageausführung in der Datenbank; dieser Durchschnitt schließt die Codierungs- und Übertragungszeit für die Ergebnismenge sowie den Aufwand aus.
`AVG_ROWS`	`FLOAT64`	Durchschnittliche Anzahl der Zeilen, die die Abfrage zurückgegeben hat
`AVG_BYTES`	`FLOAT64`	Die durchschnittliche Anzahl der von der Abfrage zurückgegebenen Datenbyte, ohne den Aufwand der Übertragungskodierung
`AVG_ROWS_SCANNED`	`FLOAT64`	Durchschnittliche Anzahl der Zeilen, die von der Abfrage gescannt wurden, ausgenommen gelöschte Werte
`AVG_CPU_SECONDS`	`FLOAT64`	Durchschnittliche Anzahl von Sekunden der CPU-Zeit, die Spanner zum Ausführen der Abfrage für alle Vorgänge aufgewendet hat
`ALL_FAILED_EXECUTION_COUNT`	`INT64`	Häufigkeit, mit der die Abfrage während des Intervalls fehlgeschlagen ist.
`ALL_FAILED_AVG_LATENCY_SECONDS`	`FLOAT64`	Durchschnittliche Zeit in Sekunden für jede Abfrageausführung, die in der Datenbank fehlgeschlagen ist dieser Durchschnitt schließt die Codierungs- und Übertragungszeit für die Ergebnismenge sowie den Aufwand aus.
`CANCELLED_OR_DISCONNECTED_EXECUTION_COUNT`	`INT64`	Häufigkeit, mit der die Abfrage vom Nutzer abgebrochen oder aufgrund einer unterbrochenen Netzwerkverbindung während des Intervalls abgebrochen wurde.
`TIMED_OUT_EXECUTION_COUNT`	`INT64`	Häufigkeit, mit der die Abfrage während des Intervalls das Zeitlimit überschritten hat.
`AVG_BYTES_WRITTEN`	`FLOAT64`	Durchschnittliche Anzahl der von der Anweisung geschriebenen Byte.
`AVG_ROWS_WRITTEN`	`FLOAT64`	Durchschnittliche Anzahl der von der Anweisung geänderten Zeilen.
`STATEMENT_COUNT`	`INT64`	Die Summe der Anweisungen, die in diesem Eintrag zusammengefasst sind. Bei regulären Abfragen und DML entspricht dies der Ausführungsanzahl. Bei Batch-DML erfasst Spanner die Anzahl der Anweisungen im Batch.
`RUN_IN_RW_TRANSACTION_EXECUTION_COUNT`	`INT64`	Die Häufigkeit, mit der die Abfrage als Teil einer Lese-/Schreibtransaktion ausgeführt wurde. Anhand dieser Spalte können Sie feststellen, ob Sie Konflikte bei Sperren vermeiden können, indem Sie die Abfrage in eine schreibgeschützte Transaktion verschieben.
`LATENCY_DISTRIBUTION`	`ARRAY<STRUCT>`	Ein Histogramm der Abfrageausführungszeit. Die Werte werden in Sekunden gemessen. Hinweis zur PostgreSQL-Oberfläche: Datenbanken mit PostgreSQL-Dialekt unterstützen diese Spalte nicht. Das Array enthält ein einzelnes Element und hat den folgenden Typ: `ARRAY<STRUCT< COUNT INT64, MEAN FLOAT64, SUM_OF_SQUARED_DEVIATION FLOAT64, NUM_FINITE_BUCKETS INT64, GROWTH_FACTOR FLOAT64, SCALE FLOAT64, BUCKET_COUNTS ARRAY<INT64>>>` Weitere Informationen zu den Werten finden Sie unter Verteilung. Um die Perzentil-Latenz aus der Verteilung zu berechnen, verwenden Sie die `SPANNER_SYS.DISTRIBUTION_PERCENTILE(distribution, n FLOAT64)`-Funktion, die das geschätzte n-te Perzentil zurückgibt. Ein ähnliches Beispiel finden Sie unter Latenz des 99. Perzentils für Abfragen ermitteln. Weitere Informationen finden Sie unter Perzentile und Verteilungsmesswerte.
`AVG_MEMORY_PEAK_USAGE_BYTES`	`FLOAT64`	Die durchschnittliche maximale Arbeitsspeichernutzung (in Byte) während der Ausführung einer verteilten Abfrage. Anhand dieser Statistik können Sie ermitteln, bei welchen Abfragen oder Tabellendaten wahrscheinlich Speicherlimits erreicht werden.
`AVG_MEMORY_USAGE_PERCENTAGE`	`FLOAT64`	Die durchschnittliche Arbeitsspeichernutzung, die während der Ausführung einer verteilten Abfrage erforderlich ist (als Prozentsatz des für diese Abfrage zulässigen Arbeitsspeicherlimits). In dieser Statistik wird nur der Arbeitsspeicher erfasst, der für die Ausführung der Abfrage erforderlich ist. Einige Betreiber verwenden zusätzlichen Pufferspeicher, um die Leistung zu verbessern. Der zusätzlich verwendete Pufferungsspeicher ist im Abfrageplan sichtbar, wird aber nicht zur Berechnung von `AVG_MEMORY_USAGE_PERCENTAGE` verwendet, da er zur Optimierung dient und nicht erforderlich ist. Anhand dieser Statistik können Sie Abfragen ermitteln, die sich dem Arbeitsspeichernutzungslimit nähern und bei denen das Risiko besteht, dass sie fehlschlagen, wenn die Datengröße zunimmt. Um das Risiko zu minimieren, dass die Abfrage fehlschlägt, können Sie sie gemäß den Best Practices für SQL optimieren oder in mehrere Teile aufteilen, die weniger Daten lesen.
`AVG_QUERY_PLAN_CREATION_TIME_SECS`	`FLOAT64`	Die durchschnittliche CPU-Zeit in Sekunden, die für die Abfragekompilierung aufgewendet wurde, einschließlich der Erstellung der Abfragelaufzeit. Wenn der Wert dieser Spalte hoch ist, sollten Sie parametrisierte Abfragen verwenden.
`AVG_FILESYSTEM_DELAY_SECS`	`FLOAT64`	Die durchschnittliche Zeit, die die Abfrage mit dem Lesen aus dem Dateisystem oder mit dem Warten auf Ein-/Ausgabe (E/A) verbringt. Anhand dieser Statistik können Sie potenzielle hohe Latenzzeiten erkennen, die durch Dateisystem-E/A verursacht werden. Um das Problem zu beheben, fügen Sie einen Index oder eine `STORING`- (GoogleSQL) oder `INCLUDE`-Klausel (PostgreSQL) zu einem vorhandenen Index hinzu.
`AVG_REMOTE_SERVER_CALLS`	`FLOAT64`	Die durchschnittliche Anzahl der Remote-Serveraufrufe (RPC), die von der Abfrage abgeschlossen wurden. Anhand dieser Statistik können Sie feststellen, ob für verschiedene Abfragen, die dieselbe Anzahl von Zeilen scannen, eine sehr unterschiedliche Anzahl von RPCs verwendet wird. Bei der Abfrage mit einem höheren RPC-Wert kann es sinnvoll sein, einen Index oder eine `STORING`- (GoogleSQL) oder `INCLUDE`-Klausel (PostgreSQL) zu einem vorhandenen Index hinzuzufügen.
`AVG_ROWS_SPOOLED`	`FLOAT64`	Die durchschnittliche Anzahl der Zeilen, die von der Abfrageanweisung auf eine temporäre Festplatte (nicht im Arbeitsspeicher) geschrieben wurden. Mit dieser Statistik können Sie Abfragen mit potenziell hoher Latenz identifizieren, die speicherintensiv sind und nicht im Arbeitsspeicher ausgeführt werden können. Um das Problem zu beheben, ändern Sie die Reihenfolge von `JOIN` oder fügen Sie einen Index hinzu, der eine erforderliche `SORT` bereitstellt.
`AVG_DISK_IO_COST`	`FLOAT64`	Die durchschnittlichen Kosten dieser Abfrage in Bezug auf die Festplattenlast von Spanner-HDDs. Mit diesem Wert können Sie relative HDD-I/O-Kostenvergleiche zwischen Lesevorgängen durchführen, die Sie in der Datenbank ausführen. Für das Abfragen von Daten auf HDD-Speicher wird die HDD-Festplattenlastkapazität der Instanz belastet. Ein höherer Wert bedeutet, dass Sie mehr HDD-Festplattenlast verwenden und Ihre Abfrage möglicherweise langsamer ist als bei Ausführung auf einer SSD. Wenn die Auslastung Ihrer HDD-Festplatte das Maximum erreicht hat, kann sich dies zusätzlich auf die Leistung Ihrer Abfragen auswirken. Sie können die gesamte HDD-Laufwerksauslastung der Instanz als Prozentsatz überwachen. Wenn Sie die Lastkapazität von HDD-Laufwerken erhöhen möchten, können Sie Ihrer Instanz weitere Verarbeitungseinheiten oder Knoten hinzufügen. Weitere Informationen finden Sie unter Rechenkapazität ändern. Um die Abfrageleistung zu verbessern, sollten Sie auch in Erwägung ziehen, einige Daten auf SSD zu verschieben. Für Arbeitslasten, die viele Festplatten-E/A-Vorgänge erfordern, empfehlen wir, häufig aufgerufene Daten auf SSD-Speicher zu speichern. Auf Daten, auf die über SSD zugegriffen wird, wird nicht die HDD-Festplattenkapazität angerechnet. Sie können bei Bedarf ausgewählte Tabellen, Spalten oder sekundäre Indexe auf SSD-Speicher speichern und gleichzeitig selten aufgerufene Daten auf HDD-Speicher belassen. Weitere Informationen finden Sie unter Übersicht über die Speicherstufen.

EXECUTION_COUNT, AVG_LATENCY_SECONDS und LATENCY_DISTRIBUTION für fehlgeschlagene Abfragen umfassen Abfragen, die aufgrund einer falschen Syntax oder eines vorübergehenden Fehlers fehlgeschlagen sind, aber bei der Wiederholung erfolgreich sind. Fehlgeschlagene und abgebrochene partitionierte DML-Anweisungen werden in diesen Statistiken nicht erfasst.

Zusammengefasste Statistiken

Außerdem gibt es Tabellen, in denen zusammengefasste Daten für alle Abfragen nachverfolgt werden, für die Spanner Statistiken für einen bestimmten Zeitraum erfasst:

SPANNER_SYS.QUERY_STATS_TOTAL_MINUTE: Abfragen in Intervallen von 1 Minute
SPANNER_SYS.QUERY_STATS_TOTAL_10MINUTE: Abfragen in Intervallen von 10 Minuten
SPANNER_SYS.QUERY_STATS_TOTAL_HOUR: Abfragen in Intervallen von 1 Stunde

Diese Tabellen haben folgende Attribute:

Jede Tabelle enthält Daten für nicht überlappende Zeitintervalle in der Länge, die der Tabellenname festlegt.
Die Intervalle beziehen sich auf die Uhrzeit. 1-Minuten-Intervalle enden nach einer vollen Minute, 10-Minuten-Intervalle enden alle 10 Minuten ab Beginn der vollen Stunde, 1-Stunden-Intervalle enden zu jeder vollen Stunde.

Beispielsweise sind die neuesten, für SQL-Abfragen verfügbaren Intervalle um 11:59:30 Uhr:
- 1 Minute: 11:58:00–11:58:59 Uhr
- 10 Minuten: 11:40:00–11:49:59 Uhr
- 1 Stunde: 10:00:00–10:59:59 Uhr
Jede Zeile enthält zusammengefasste Statistiken für alle Abfragen, die während des angegebenen Intervalls über die Datenbank ausgeführt werden. Es gibt nur eine Zeile pro Zeitintervall und enthält abgeschlossene Abfragen, fehlgeschlagene Abfragen und vom Nutzer abgebrochene Abfragen.
Die in den TOTAL-Tabellen erfassten Statistiken können Abfragen enthalten, die Spanner nicht in den TOP-Tabellen erfasst hat.
Einige Spalten in diesen Tabellen werden als Messwerte in Cloud Monitoring verfügbar gemacht. Folgende Messwerte werden bereitgestellt:
- Anzahl der Abfrageausführungen
- Fehler bei Abfragen
- Abfragelatenzen
- Anzahl der zurückgegebenen Zeilen
- Anzahl der gescannten Zeilen
- Anzahl der zurückgegebenen Byte
- CPU-Zeit für Abfrage
Weitere Informationen finden Sie unter Spanner-Messwerte.

Tabellenschema

Spaltenname	Typ	Beschreibung
`INTERVAL_END`	`TIMESTAMP`	Ende des Zeitintervalls, in dem die eingeschlossene Abfrage ausgeführt wurde
`EXECUTION_COUNT`	`INT64`	Anzahl der von Cloud Spanner während des Intervalls registrierten Ausführungen einer Anfrage
`AVG_LATENCY_SECONDS`	`FLOAT64`	Durchschnittliche Zeit in Sekunden für jede Abfrageausführung in der Datenbank; dieser Durchschnitt schließt die Codierungs- und Übertragungszeit für die Ergebnismenge sowie den Aufwand aus.
`AVG_ROWS`	`FLOAT64`	Durchschnittliche Anzahl der Zeilen, die die Abfrage zurückgegeben hat
`AVG_BYTES`	`FLOAT64`	Die durchschnittliche Anzahl der von der Abfrage zurückgegebenen Datenbyte, ohne den Aufwand der Übertragungskodierung
`AVG_ROWS_SCANNED`	`FLOAT64`	Durchschnittliche Anzahl der Zeilen, die von der Abfrage gescannt wurden, ausgenommen gelöschte Werte
`AVG_CPU_SECONDS`	`FLOAT64`	Durchschnittliche Anzahl von Sekunden der CPU-Zeit, die Spanner zum Ausführen der Abfrage für alle Vorgänge aufgewendet hat
`ALL_FAILED_EXECUTION_COUNT`	`INT64`	Häufigkeit, mit der die Abfrage während des Intervalls fehlgeschlagen ist.
`ALL_FAILED_AVG_LATENCY_SECONDS`	`FLOAT64`	Durchschnittliche Zeit in Sekunden für jede Abfrageausführung, die in der Datenbank fehlgeschlagen ist dieser Durchschnitt schließt die Codierungs- und Übertragungszeit für die Ergebnismenge sowie den Aufwand aus.
`CANCELLED_OR_DISCONNECTED_EXECUTION_COUNT`	`INT64`	Häufigkeit, mit der die Abfrage vom Nutzer abgebrochen oder aufgrund einer unterbrochenen Netzwerkverbindung während des Intervalls abgebrochen wurde.
`TIMED_OUT_EXECUTION_COUNT`	`INT64`	Häufigkeit, mit der die Abfrage während des Intervalls das Zeitlimit überschritten hat.
`AVG_BYTES_WRITTEN`	`FLOAT64`	Durchschnittliche Anzahl der von der Anweisung geschriebenen Byte.
`AVG_ROWS_WRITTEN`	`FLOAT64`	Durchschnittliche Anzahl der von der Anweisung geänderten Zeilen.
`RUN_IN_RW_TRANSACTION_EXECUTION_COUNT`	`INT64`	Die Anzahl der Abfragen, die im Rahmen von Lese-/Schreibtransaktionen ausgeführt wurden. Anhand dieser Spalte können Sie feststellen, ob Sie Konflikte bei Sperren vermeiden können, indem Sie einige Abfragen in Nur-Lese-Transaktionen verschieben.
`LATENCY_DISTRIBUTION`	`ARRAY<STRUCT>`	Ein Histogramm der Ausführungszeit für alle Abfragen. Die Werte werden in Sekunden gemessen. Hinweis zur PostgreSQL-Oberfläche: Datenbanken mit PostgreSQL-Dialekt unterstützen diese Spalte nicht. Geben Sie das Array so an: `ARRAY<STRUCT< COUNT INT64, MEAN FLOAT64, SUM_OF_SQUARED_DEVIATION FLOAT64, NUM_FINITE_BUCKETS INT64, GROWTH_FACTOR FLOAT64, SCALE FLOAT64, BUCKET_COUNTS ARRAY<INT64>>>` Weitere Informationen zu den Werten finden Sie unter Verteilung. Um die Perzentil-Latenz aus der Verteilung zu berechnen, verwenden Sie die `SPANNER_SYS.DISTRIBUTION_PERCENTILE(distribution, n FLOAT64)`-Funktion, die das geschätzte n-te Perzentil zurückgibt. Ein ähnliches Beispiel finden Sie unter Latenz des 99. Perzentils für Abfragen ermitteln. Weitere Informationen finden Sie unter Perzentile und Verteilungsmesswerte.

Datenaufbewahrung

Spanner speichert die Daten für jede Tabelle mindestens für die folgenden Zeiträume:

SPANNER_SYS.QUERY_STATS_TOP_MINUTE und SPANNER_SYS.QUERY_STATS_TOTAL_MINUTE: Intervalle der letzten 6 Stunden.
SPANNER_SYS.QUERY_STATS_TOP_10MINUTE und SPANNER_SYS.QUERY_STATS_TOTAL_10MINUTE: Intervalle der letzten 4 Tage.
SPANNER_SYS.QUERY_STATS_TOP_HOUR und SPANNER_SYS.QUERY_STATS_TOTAL_HOUR: Intervalle der letzten 30 Tage.

Beispielabfragen

Dieser Abschnitt enthält mehrere Beispiel-SQL-Anweisungen, die Abfragestatistiken abrufen. Sie können diese SQL-Anweisungen mit den Clientbibliotheken, der Google Cloud CLI oder der Google Cloud -Konsole ausführen.

Grundlegende Statistiken für jede Abfrage in einem bestimmten Zeitraum auflisten

Die folgende Abfrage gibt die Rohdaten für die Top-Abfragen der vorherigen Minute zurück:

SELECT text,
       request_tag,
       interval_end,
       execution_count,
       avg_latency_seconds,
       avg_rows,
       avg_bytes,
       avg_rows_scanned,
       avg_cpu_seconds
FROM spanner_sys.query_stats_top_minute
ORDER BY interval_end DESC;

Statistiken für partitionierte DML-Anweisungen auflisten, die länger als eine Stunde ausgeführt werden

Die folgende Abfrage gibt die Ausführungsanzahl und die durchschnittliche Anzahl der von den partitionierten DML-Top-Abfragen der letzten Stunden geschriebenen Zeilen zurück:

SELECT text,
       request_tag,
       interval_end,
       sum(execution_count) as execution_count
       sum(avg_rows_written*execution_count)/sum(execution_count) as avg_rows_written
FROM spanner_sys.query_stats_top_hour
WHERE starts_with(text, "UPDATE") AND query_type = "PARTITIONED_QUERY"
group by text, request_tag, interval_end
ORDER BY interval_end DESC;

Abfragen mit der höchsten CPU-Nutzung auflisten

Die folgende Abfrage gibt die Abfragen mit der höchsten CPU-Nutzung der vorherigen Stunde zurück:

SELECT text,
       request_tag,
       execution_count AS count,
       avg_latency_seconds AS latency,
       avg_cpu_seconds AS cpu,
       execution_count * avg_cpu_seconds AS total_cpu
FROM spanner_sys.query_stats_top_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_hour)
ORDER BY total_cpu DESC;

Gesamtausführungsanzahl in einem bestimmten Zeitraum ermitteln

Die folgende Abfrage gibt die Gesamtzahl der im letzten vollständigen 1-Minuten-Intervall ausgeführten Abfragen zurück:

SELECT interval_end,
       execution_count
FROM spanner_sys.query_stats_total_minute
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_minute);

Durchschnittliche Latenzzeit für eine Abfrage ermitteln

Die folgende Abfrage gibt die durchschnittliche Latenzzeit für eine bestimmte Abfrage zurück:

SELECT avg_latency_seconds
FROM spanner_sys.query_stats_top_hour
WHERE text LIKE "SELECT x FROM table WHERE x=@foo;";

Latenz des 99. Perzentils für Abfragen ermitteln

Die folgende Abfrage gibt das 99. Perzentil der Ausführungszeit für Abfragen zurück, die in den letzten 10 Minuten ausgeführt wurden:

SELECT interval_end, avg_latency_seconds, SPANNER_SYS.DISTRIBUTION_PERCENTILE(latency_distribution[OFFSET(0)], 99.0)
  AS percentile_latency
FROM spanner_sys.query_stats_total_10minute
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_total_10minute)
ORDER BY interval_end;

Wenn Sie die durchschnittliche Latenz mit der Latenz des 99. Perzentils vergleichen, können Sie mögliche Ausreißerabfragen mit langen Ausführungszeiten identifizieren.

Abfragen finden, die die meisten Daten scannen

Sie können die Anzahl der von einer Abfrage gescannten Zeilen als Maß für die Datenmenge verwenden, die von der Abfrage gescannt wurde. Die folgende Abfrage gibt die Anzahl der Zeilen zurück, die von Abfragen gescannt wurden, die in der vorherigen Stunde ausgeführt wurden:

SELECT text,
       execution_count,
       avg_rows_scanned
FROM spanner_sys.query_stats_top_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_hour)
ORDER BY avg_rows_scanned DESC;

Anweisungen finden, mit denen die meisten Daten geschrieben wurden

Sie können die Anzahl der von DML geschriebenen Zeilen (oder Bytes) als Maß für die Datenmenge verwenden, die von der Abfrage geändert wurde. Die folgende Abfrage gibt die Anzahl der Zeilen zurück, die von DML-Anweisungen geschrieben wurden, die in der vorherigen Stunde ausgeführt wurden:

SELECT text,
       execution_count,
       avg_rows_written
FROM spanner_sys.query_stats_top_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_hour)
ORDER BY avg_rows_written DESC;

Gesamtsumme der CPU-Nutzung über alle Abfragen hinweg

Die folgende Abfrage gibt die Anzahl der in der vorherigen Stunde verwendeten CPU-Stunden zurück:

SELECT (avg_cpu_seconds * execution_count / 60 / 60)
  AS total_cpu_hours
FROM spanner_sys.query_stats_total_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_total_hour);

Abfragen auflisten, die in einem bestimmten Zeitraum fehlgeschlagen sind

Die folgende Abfrage gibt die Rohdaten zurück, einschließlich Ausführungsanzahl und durchschnittlicher Latenz fehlgeschlagener Abfragen für die Top-Abfragen der vorherigen Minute. Fehlgeschlagene und abgebrochene partitionierte DML-Anweisungen werden in diesen Statistiken nicht erfasst.

SELECT text,
       request_tag,
       interval_end,
       execution_count,
       all_failed_execution_count,
       all_failed_avg_latency_seconds,
       avg_latency_seconds,
       avg_rows,
       avg_bytes,
       avg_rows_scanned,
       avg_cpu_seconds
FROM spanner_sys.query_stats_top_minute
WHERE all_failed_execution_count > 0
ORDER BY interval_end;

Gesamtfehleranzahl in einem bestimmten Zeitraum ermitteln

Die folgende Abfrage gibt die Gesamtzahl der Abfragen zurück, die im letzten vollständigen 1-Minuten-Intervall nicht ausgeführt werden konnten. Diese Statistiken erfassen keine fehlgeschlagenen und abgebrochenen partitionierten DML-Anweisungen.

SELECT interval_end,
       all_failed_execution_count
FROM spanner_sys.query_stats_total_minute
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_minute)
ORDER BY interval_end;

Abfragen auflisten, die am meisten Zeitüberschreitung haben

Die folgende Abfrage gibt die Abfragen mit der höchsten Zeitüberschreitung in der vorherigen Stunde zurück.

SELECT text,
       execution_count AS count,
       timed_out_execution_count AS timeout_count,
       avg_latency_seconds AS latency,
       avg_cpu_seconds AS cpu,
       execution_count * avg_cpu_seconds AS total_cpu
FROM spanner_sys.query_stats_top_hour
WHERE interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.query_stats_top_hour)
ORDER BY timed_out_execution_count DESC;

Durchschnittliche Latenz erfolgreicher und fehlgeschlagener Ausführungen einer Abfrage ermitteln

Die folgende Abfrage gibt die kombinierte durchschnittliche Latenz, die durchschnittliche Latenz für erfolgreiche Ausführungen und die durchschnittliche Latenz für fehlgeschlagene Ausführungen für eine bestimmte Abfrage zurück. In diesen Statistiken werden fehlgeschlagene und abgebrochene partitionierte DML-Anweisungen nicht erfasst.

SELECT avg_latency_seconds AS combined_avg_latency,
       all_failed_avg_latency_seconds AS failed_execution_latency,
       ( avg_latency_seconds * execution_count -
         all_failed_avg_latency_seconds * all_failed_execution_count
       ) / (
       execution_count - all_failed_execution_count ) AS success_execution_latency
FROM   spanner_sys.query_stats_top_hour
WHERE  text LIKE "select x from table where x=@foo;";

Fehlerbehebung bei hoher CPU-Auslastung oder erhöhter Abfragelatenz mit Abfragestatistiken

Abfragestatistiken sind nützlich, wenn Sie eine hohe CPU-Auslastung in Ihrer Spanner-Datenbank untersuchen oder einfach nur die CPU-intensiven Abfrageformen in Ihrer Datenbank verstehen möchten. Das Prüfen von Abfragen, die erhebliche Mengen an Datenbankressourcen beanspruchen, bietet Spanner-Nutzern eine potenzielle Möglichkeit, die Betriebskosten zu senken und möglicherweise die allgemeinen Systemlatenzen zu verbessern.

Sie können SQL-Code oder das Query Insights-Dashboard verwenden, um problematische Abfragen in Ihrer Datenbank zu untersuchen. In den folgenden Abschnitten wird beschrieben, wie Sie solche Anfragen mit SQL-Code untersuchen können.

Im folgenden Beispiel liegt der Fokus auf der CPU-Auslastung. Es können ähnliche Schritte ausgeführt werden, um eine erhöhte Abfragelatenz zu beheben und die Abfragen mit den höchsten Latenzen zu ermitteln. Wählen Sie einfach Zeitintervalle und Abfragen nach Latenz anstatt nach CPU-Auslastung aus.

Zeitraum für die Untersuchung auswählen

Starten Sie die Prüfung mit der Suche nach einem Zeitpunkt, an dem Ihre Anwendung begann, eine hohe CPU-Auslastung zu verzeichnen. Beispiel: Das Problem trat am 24. Juli 2020 um 17:00 Uhr auf.

Abfragestatistiken für den ausgewählten Zeitraum erfassen

Nachdem ein Zeitraum zum Starten der Prüfung ausgewählt wurde, betrachten wir die Statistikdaten, die etwa zu diesem Zeitpunkt in der Tabelle QUERY_STATS_TOTAL_10MINUTE gesammelt wurden. Die Ergebnisse dieser Abfrage können darauf hinweisen, wie sich die CPU und andere Abfragestatistiken in diesem Zeitraum geändert haben.

Die folgende Abfrage gibt die zusammengefassten Abfragestatistiken von 16:30 bis einschließlich 17:30 UTC zurück. Wir verwenden ROUND in unserer Abfrage, um die Anzahl der Dezimalstellen für Anzeigezwecke einzuschränken.

SELECT interval_end,
       execution_count AS count,
       ROUND(avg_latency_seconds,2) AS latency,
       ROUND(avg_rows,2) AS rows_returned,
       ROUND(avg_bytes,2) AS bytes,
       ROUND(avg_rows_scanned,2) AS rows_scanned,
       ROUND(avg_cpu_seconds,3) AS avg_cpu
FROM spanner_sys.query_stats_total_10minute
WHERE
  interval_end >= "2020-07-24T16:30:00Z"
  AND interval_end <= "2020-07-24T17:30:00Z"
ORDER BY interval_end;

Die Abfrage liefert folgende Ergebnisse.

interval_end	count	Latenz	rows_returned	Byte	rows_scanned	avg_cpu
2020-07-24T16:30:00Z	6	0,06	5,00	536,00	16,67	0,035
2020-07-24T16:40:00Z	55	0,02	0.22	25,29	0.22	0,004
2020-07-24T16:50:00Z	102	0,02	0,30	33,35	0,30	0,004
`2020-07-24T17:00:00Z`	`154`	`1.06`	`4.42`	`486.33`	`7792208.12`	`4.633`
2020-07-24T17:10:00Z	94	0,02	1,68	106,84	1,68	0,006
2020-07-24T17:20:00Z	110	0,02	0,38	34,60	0,38	0,005
2020-07-24T17:30:00Z	47	0,02	0.23	24,96	0.23	0,004

In der vorherigen Tabelle sehen Sie, dass die durchschnittliche CPU-Zeit (die Spalte avg_cpu) in der Ergebnistabelle in den hervorgehobenen Intervallen um 17:00 Uhr am höchsten ist. Außerdem sehen wir eine durchschnittlich viel höhere Anzahl von Zeilen, die gescannt werden. Dies zeigt an, dass teurere Abfragen zwischen 16:50 und 17:00 Uhr ausgeführt wurden. Wir wählen dieses Intervall aus, um es im nächsten Schritt genauer zu untersuchen.

Abfragen ermitteln, die eine hohe CPU-Nutzung verursachen

Wir prüfen nun die ausgewählte Tabelle QUERY_STATS_TOP_10MINUTE mit einem Zeitintervall, um den ausgewählten Wert zu untersuchen. Die Ergebnisse dieser Abfrage können dabei helfen, zu erkennen, welche Abfragen eine hohe CPU-Auslastung verursachen.

SELECT text_fingerprint AS fingerprint,
       execution_count AS count,
       ROUND(avg_latency_seconds,2) AS latency,
       ROUND(avg_cpu_seconds,3) AS cpu,
       ROUND(execution_count * avg_cpu_seconds,3) AS total_cpu
FROM spanner_sys.query_stats_top_10MINUTE
WHERE
  interval_end = "2020-07-24T17:00:00Z"
ORDER BY total_cpu DESC;

Die Abfrage liefert folgende Ergebnisse.

Fingerprint	count	Latenz	CPU	total_cpu
`5505124206529314852`	`30`	`3.88`	`17.635`	`529.039`
`1697951036096498470`	`10`	`4.49`	`18.388`	`183.882`
2295109096748351518	1	0,33	0,048	0,048
11618299167612903606	1	0,25	0,021	0,021
10302798842433860499	1	0,04	0,006	0,006
123771704548746223	1	0,04	0,006	0,006
4216063638051261350	1	0,04	0,006	0,006
3654744714919476398	1	0,04	0,006	0,006
2999453161628434990	1	0,04	0,006	0,006
823179738756093706	1	0,02	0,005	0.0056

Die beiden wichtigsten Abfragen, die in der Ergebnistabelle hervorgehoben sind, sind Ausreißer in Bezug auf durchschnittliche CPU- und Latenz sowie Anzahl der Ausführungen und Gesamt-CPU. Sehen Sie sich die erste Abfrage an, die in diesen Ergebnissen aufgeführt ist.

Abfrageausführungen im Zeitverlauf vergleichen

Nachdem wir die Untersuchung eingegrenzt haben, können wir uns der Tabelle QUERY_STATS_TOP_MINUTE widmen. Durch den Vergleich von Durchläufen für eine bestimmte Abfrage können wir nach Korrelationen zwischen der Anzahl der zurückgegebenen Zeilen oder Byte oder der Anzahl der gescannten und erhöhten CPUs oder Latenzen suchen. Eine Abweichung kann auf eine Ungleichförmigkeit in den Daten hinweisen. Eine konstant hohe Anzahl von gescannten Zeilen kann auf das Fehlen der entsprechenden Indexe oder der nicht optimalen Join-Reihenfolge hinweisen.

Untersuchen Sie die Abfrage mit der höchsten durchschnittlichen CPU-Auslastung und der höchsten Latenz. Dazu führen Sie die folgende Anweisung aus, die nach dem text_fingerprint dieser Abfrage filtert.

SELECT interval_end,
       ROUND(avg_latency_seconds,2) AS latency,
       avg_rows AS rows_returned,
       avg_bytes AS bytes_returned,
       avg_rows_scanned AS rows_scanned,
       ROUND(avg_cpu_seconds,3) AS cpu,
FROM spanner_sys.query_stats_top_minute
WHERE text_fingerprint = 5505124206529314852
ORDER BY interval_end DESC;

Die Abfrage liefert folgende Ergebnisse.

interval_end	Latenz	rows_returned	bytes_returned	rows_scanned	CPU
2020-07-24T17:00:00Z	4.55	21	2365	30000000	19.255
2020-07-24T16:00:00Z	3,62	21	2365	30000000	17,255
2020-07-24T15:00:00Z	4,37	21	2365	30000000	18,350
2020-07-24T14:00:00Z	4,02	21	2365	30000000	17,748
2020-07-24T13:00:00Z	3.12	21	2365	30000000	16,380
2020-07-24T12:00:00Z	3,45	21	2365	30000000	15,476
2020-07-24T11:00:00Z	4,94	21	2365	30000000	22,611
2020-07-24T10:00:00Z	6,48	21	2365	30000000	21,265
2020-07-24T09:00:00Z	0.23	21	2365	5	0,040
2020-07-24T08:00:00Z	0,04	21	2365	5	0,021
2020-07-24T07:00:00Z	0,09	21	2365	5	0,030

Bei der Untersuchung der vorhergehenden Ergebnisse sehen wir, dass sich die Anzahl der gescannten Zeilen, die verwendete CPU und die Latenz alle gegen 9:00 Uhr erheblich geändert haben. Um zu verstehen, warum diese Zahlen so drastisch angestiegen sind, untersuchen wir den Abfragetext und prüfen, ob sich Änderungen im Schema auf die Abfrage ausgewirkt haben könnten.

Verwenden Sie die folgende Abfrage, um den Abfragetext für die untersuchte Abfrage abzurufen.

SELECT text,
       text_truncated
FROM spanner_sys.query_stats_top_hour
WHERE text_fingerprint = 5505124206529314852
LIMIT 1;

Dies gibt das folgende Ergebnis zurück.

text	text_truncated
select * aus Bestellungen mit o_custkey = 36901;	falsch

Bei der Überprüfung des zurückgegebenen Abfragetexts sehen wir, dass die Abfrage nach einem Feld namens o_custkey filtert. Dies ist eine Nicht-Schlüsselspalte in der Tabelle orders. In diesem Fall war bis zu 9:00 Uhr ein Index für diese Spalte vorhanden. Dies erklärt die Änderung der Kosten für diese Abfrage. Wir können den Index wieder hinzufügen oder, wenn die Abfrage selten ausgeführt wird, entscheiden, dass wir den Index nicht haben und die höheren Lesekosten akzeptieren.

Unsere Untersuchung hat sich bisher auf Abfragen konzentriert, die erfolgreich abgeschlossen wurden, und wir haben einen Grund dafür gefunden, warum die Datenbank eine gewisse Beeinträchtigung der Leistung aufweist. Im nächsten Schritt konzentrieren wir uns auf fehlgeschlagene oder abgebrochene Abfragen und zeigen, wie Sie diese Daten untersuchen können, um weitere Informationen zu erhalten.

Fehlgeschlagene Abfragen untersuchen

Abfragen, die nicht erfolgreich abgeschlossen werden, verbrauchen weiterhin Ressourcen, bevor eine Zeitüberschreitung auftritt, werden abgebrochen oder anderweitig fehlschlagen. Spanner verfolgt die Anzahl der Ausführungen und die Ressourcen, die von fehlgeschlagenen Abfragen zusammen mit erfolgreichen Abfragen verbraucht wurden. In diesen Statistiken werden fehlgeschlagene und abgebrochene partitionierte DML-Anweisungen nicht erfasst.

Um zu prüfen, ob fehlgeschlagene Abfragen einen erheblichen Einfluss auf die Systemauslastung haben, können wir zuerst prüfen, wie viele Abfragen im gewünschten Zeitintervall fehlgeschlagen sind.

SELECT interval_end,
       all_failed_execution_count AS failed_count,
       all_failed_avg_latency_seconds AS latency
FROM spanner_sys.query_stats_total_minute
WHERE
  interval_end >= "2020-07-24T16:50:00Z"
  AND interval_end <= "2020-07-24T17:00:00Z"
ORDER BY interval_end;

interval_end	failed_count	Latenz
2020-07-24T16:52:00Z	1	15,211391
2020-07-24T16:53:00Z	3	58,312232

Wir können weiter untersuchen, indem wir nach Abfragen suchen, die mit der folgenden Abfrage am wahrscheinlichsten fehlschlagen.

SELECT interval_end,
       text_fingerprint,
       execution_count,
       avg_latency_seconds AS avg_latency,
       all_failed_execution_count AS failed_count,
       all_failed_avg_latency_seconds AS failed_latency,
       cancelled_or_disconnected_execution_count AS cancel_count,
       timed_out_execution_count AS to_count
FROM spanner_sys.query_stats_top_minute
WHERE all_failed_execution_count > 0
ORDER BY interval_end;

interval_end	text_fingerprint	execution_count	failed_count	cancel_count	to_count
2020-07-24T16:52:00Z	5505124206529314852	3	1	1	0
2020-07-24T16:53:00Z	1697951036096498470	2	1	1	0
2020-07-24T16:53:00Z	5505124206529314852	5	2	1	1

Wie die vorherige Tabelle zeigt, ist die Abfrage mit dem Fingerabdruck 5505124206529314852 in verschiedenen Zeitintervallen mehrmals fehlgeschlagen. Angesichts eines solchen Ausfallmusters ist es interessant, die Latenz erfolgreicher und fehlgeschlagener Ausführungen zu vergleichen.

SELECT interval_end,
       avg_latency_seconds AS combined_avg_latency,
       all_failed_avg_latency_seconds AS failed_execution_latency,
       ( avg_latency_seconds * execution_count -
         all_failed_avg_latency_seconds * all_failed_execution_count
       ) / (
       execution_count - all_failed_execution_count ) AS success_execution_latency
FROM   spanner_sys.query_stats_top_hour
WHERE  text_fingerprint = 5505124206529314852;

interval_end	combined_avg_latency	failed_execution_latency	success_execution_latency
2020-07-24T17:00:00Z	3,880420	13,830709	2,774832

Best Practices anwenden

Nachdem wir eine Kandidatenabfrage zur Optimierung ermittelt haben, können wir als Nächstes das Abfrageprofil betrachten und versuchen, eine Optimierung mit Best Practices für SQL durchzuführen.

Nächste Schritte

Ermitteln Sie mit der ältesten aktiven Abfragen die am längsten aktiven Abfragen.
Hohe CPU-Auslastung untersuchen
Weitere Informationen zu Tools zur Selbstbeobachtung
Weitere Informationen zu dem, was Spanner für jede Datenbank in den Informationsschematabellen der Datenbank speichert
SQL-Best-Practices für Spanner