Diese Seite wurde von der Cloud Translation API übersetzt.

Statistiken sperren

Spanner bietet Sperrstatistiken, mit denen Sie während eines bestimmten Zeitraums die Zeilenschlüssel und Tabellenspalten identifizieren können, die die wichtigsten Quellen von Transaktionssperrekonflikten in Ihrer Datenbank waren. Sie können diese Statistiken mithilfe von SQL-Anweisungen aus den SPANNER_SYS.LOCK_STATS*-Systemtabellen abrufen.

Statistiken zur Sperrung aufrufen

Spanner stellt die Sperrstatistiken im Schema SPANNER_SYS bereit. Sie haben folgende Möglichkeiten, auf SPANNER_SYS-Daten zuzugreifen:

Die Spanner Studio-Seite einer Datenbank in der Google Cloud -Konsole
Befehl gcloud spanner databases execute-sql
Das Dashboard Statistiken zu Sperren.
Die Methode executeSql oder executeStreamingSql.

Die folgenden von Spanner bereitgestellten Einzellesemethoden unterstützen SPANNER_SYS nicht:
- Starken Lesevorgang aus einer einzelnen Zeile oder mehreren Zeilen in einer Tabelle durchführen
- Veralteten Lesevorgang aus einer einzelnen Zeile oder mehreren Zeilen in einer Tabelle durchführen
- Aus einer einzelnen Zeile oder mehreren Zeilen in einem sekundären Index lesen

Statistiken nach Zeilenschlüssel sperren

In den folgenden Tabellen wird der Zeilenschlüssel mit der höchsten Wartezeit nachverfolgt:

SPANNER_SYS.LOCK_STATS_TOP_MINUTE: Zeilenschlüssel mit der höchsten Sperrwartezeit in 1-Minuten-Intervallen.
SPANNER_SYS.LOCK_STATS_TOP_10MINUTE: Zeilenschlüssel mit der höchsten Sperrwartezeit in 10-Minuten-Intervallen.
SPANNER_SYS.LOCK_STATS_TOP_HOUR: Zeilenschlüssel mit der Sperrwartezeit in 1-Stunden-Intervallen.

Diese Tabellen haben folgende Attribute:

Jede Tabelle enthält Daten für nicht überlappende Zeitintervalle in der Länge, die der Tabellenname festlegt.
Die Intervalle basieren auf der Uhrzeit. 1-Minuten-Intervalle enden nach einer Minute, 10-Minuten-Intervalle enden alle 10 Minuten ab Beginn der vollen Stunde, 1-Stunden-Intervalle enden zu jeder Stunde. Nach jedem Intervall erfasst Spanner Daten von allen Servern und stellt die Daten danach in den SPANNER_SYS-Tabellen bereit.

Beispielsweise sind die neuesten, für SQL-Abfragen verfügbaren Intervalle um 11:59:30 Uhr:
- 1 Minute: 11:58:00–11:58:59 Uhr
- 10 Minuten: 11:40:00–11:49:59 Uhr
- 1 Stunde: 10:00:00–10:59:59 Uhr
Cloud Spanner gruppiert die Statistiken nach dem Zeilenschlüsselbereich.
Jede Zeile enthält Statistiken für die Gesamtwartezeit eines bestimmten Startschlüssels, für die Spanner während des angegebenen Intervalls Statistiken erfasst.
Wenn Spanner keine Informationen zu jedem Zeilenschlüsselbereich für Sperren während des Intervalls speichern kann, priorisiert das System den Zeilenschlüsselbereich mit der höchsten Wartezeit im angegebenen Intervall.
Alle Spalten in den Tabellen sind nullable.

Tabellenschema

Spaltenname	Typ	Beschreibung
`INTERVAL_END`	`TIMESTAMP`	Ende des Zeitintervalls, in dem die enthaltenen Sperrkonflikte aufgetreten sind.
`ROW_RANGE_START_KEY`	`BYTES(MAX)`	Der Zeilenschlüssel, in dem der Sperrkonflikt aufgetreten ist. Wenn der Konflikt einen Bereich von Zeilen beinhaltet, stellt dieser Wert den Startschlüssel dieses Bereichs dar. Ein Pluszeichen, `+`, bezeichnet einen Bereich. Weitere Informationen finden Sie unter Was ist ein Startschlüssel für einen Zeilenbereich?.
`LOCK_WAIT_SECONDS`	`FLOAT64`	Die kumulative Wartezeit der Sperre von Sperrkonflikten, die für alle Spalten im Zeilenschlüsselbereich aufgezeichnet wurden, in Sekunden.
`SAMPLE_LOCK_REQUESTS`	`ARRAY<STRUCT< column STRING, lock_mode STRING, transaction_tag STRING>>`	Jeder Eintrag in diesem Array entspricht einer Beispielsperre für die Sperrung, die zum Sperrenkonflikt beigetragen hat, indem sie entweder auf eine Sperre gewartet oder andere Transaktionen daran gehindert hat, die Sperre für den angegebenen Zeilenschlüssel (Bereich) zu übernehmen. Die maximale Anzahl von Stichproben in diesem Array beträgt 20. Hinweis zur PostgreSQL-Oberfläche: Datenbanken mit PostgreSQL-Dialekt unterstützen diese Spalte nicht. Jedes Beispiel enthält die folgenden drei Felder: `lock_mode`: Der angeforderte Sperrmodus. Weitere Informationen finden Sie unter Sperren . `column`: Die Spalte, in der der Sperrkonflikt aufgetreten ist. Das Format dieses Werts ist `tablename.columnname`. `transaction_tag`: Das Tag der Transaktion, die die Anfrage gesendet hat. Weitere Informationen zur Verwendung von Tags finden Sie unter Fehlerbehebung mit Transaktions-Tags. Alle Sperranfragen, die zu Sperrenkonflikten beigetragen haben, werden gleichmäßig zufällig ausgewählt. Daher ist es möglich, dass nur die Hälfte eines Konflikts (entweder der Inhaber oder der Wartende) in diesem Array aufgezeichnet wird.

Sperrmodi

Spanner-Vorgänge erhalten Sperren, wenn die Vorgänge Teil einer Lese-Schreib-Transaktion sind. Schreibgeschützte Transaktionen erhalten keine Sperren. Spanner verwendet verschiedene Sperrmodi, um die Anzahl der Transaktionen zu maximieren, die zu einer bestimmten Zeit Zugriff auf eine bestimmte Datenzelle haben. Unterschiedliche Sperren haben unterschiedliche Eigenschaften. Beispielsweise können einige Sperren von mehreren Transaktionen gemeinsam genutzt werden, andere hingegen nicht.

Ein Sperrkonflikt kann auftreten, wenn Sie versuchen, einen der folgenden Sperrmodi in einer Transaktion zu erhalten.

ReaderShared-Sperre: Eine Sperre, mit der andere Lesevorgänge weiterhin auf die Daten zugreifen können, bis die Transaktion zum Commit bereit ist. Diese gemeinsame Sperre wird abgerufen, wenn eine Lese-Schreib-Transaktion Daten liest.
WriterShared-Sperre: Diese Sperre wird abgerufen, wenn eine Lese-Schreib-Transaktion versucht, einen Commit durchzuführen.
Exclusive: Eine exklusive Sperre wird erworben, wenn eine Lese-/Schreibtransaktion, die bereits eine ReaderShared-Sperre erhalten hat, versucht, Daten nach Abschluss des Lesevorgangs zu schreiben. Eine exklusive Sperre ist ein Upgrade von einer ReaderShared-Sperre. Eine exklusive Sperre ist ein Sonderfall einer Transaktion, die gleichzeitig die ReaderShared-Sperre und die WriterShared-Sperre enthält. Keine andere Transaktion kann eine Sperre für dieselbe Zelle abrufen.
WriterSharedTimestamp-Sperre: Eine spezielle Art von WriterShared-Sperre, die beim Einfügen neuer Zeilen in eine Tabelle mit einem Commit-Zeitstempel als Teil des Primärschlüssels erworben wird. Diese Art der Sperre verhindert, dass Transaktionsteilnehmer genau dieselbe Zeile erstellen und somit in Konflikt stehen. Spanner aktualisiert den Schlüssel der eingefügten Zeile, damit er mit dem Commit-Zeitstempel der Transaktion übereinstimmt, die die Einfügung ausgeführt hat.

Weitere Informationen zu Transaktionstypen und den verfügbaren Sperren finden Sie unter Transaktionen.

Konflikte mit Sperrmodus

Die folgende Tabelle zeigt die möglichen Konflikte zwischen verschiedenen Sperrmodi.

Sperrmodi	`ReaderShared`	`WriterShared`	`Exclusive`	`WriterSharedTimestamp`
`ReaderShared`	Nein	Ja	Ja	Ja
`WriterShared`	Ja	Nein	Ja	Nicht zutreffend
`Exclusive`	Ja	Ja	Ja	Nicht zutreffend
`WriterSharedTimestamp`	Ja	Nicht zutreffend	Nicht zutreffend	Ja

WriterSharedTimestamp-Sperren werden nur verwendet, wenn neue Zeilen mit einem Zeitstempel als Teil des Primärschlüssels eingefügt werden. Die Sperren WriterShared und Exclusive werden verwendet, wenn in vorhandene Zellen geschrieben oder neue Zeilen ohne Zeitstempel eingefügt werden. Daher kann WriterSharedTimestamp nicht mit anderen Arten von Sperren in Konflikt stehen und diese Szenarien werden in der obigen Tabelle als Nicht zutreffend angezeigt.

Die einzige Ausnahme ist ReaderShared, das auf nicht vorhandene Zeilen angewendet werden kann und daher mit WriterSharedTimestamp in Konflikt stehen kann. Beispiel: Ein vollständiger Tabellenscan sperrt die gesamte Tabelle auch für Zeilen, die noch nicht erstellt wurden. Daher kann ReaderShared mit WriterSharedTimestamp in Konflikt stehen.

Was ist ein Startschlüssel für einen Zeilenbereich?

Die Spalte ROW_RANGE_START_KEY gibt den zusammengesetzten Primärschlüssel an oder beginnt den Primärschlüssel eines Zeilenbereichs mit Sperrenkonflikten. Das folgende Schema dient zur Veranschaulichung eines Beispiels.

CREATE TABLE Singers (
  SingerId   INT64 NOT NULL,
  FirstName  STRING(1024),
  LastName   STRING(1024),
  SingerInfo BYTES(MAX),
) PRIMARY KEY (SingerId);

CREATE TABLE Albums (
  SingerId     INT64 NOT NULL,
  AlbumId      INT64 NOT NULL,
  AlbumTitle   STRING(MAX),
) PRIMARY KEY (SingerId, AlbumId),
  INTERLEAVE IN PARENT Singers ON DELETE CASCADE;

CREATE TABLE Songs (
  SingerId     INT64 NOT NULL,
  AlbumId      INT64 NOT NULL,
  TrackId      INT64 NOT NULL,
  SongName     STRING(MAX),
) PRIMARY KEY (SingerId, AlbumId, TrackId),
  INTERLEAVE IN PARENT Albums ON DELETE CASCADE;

CREATE TABLE Users (
  UserId     INT64 NOT NULL,
  LastAccess TIMESTAMP NOT NULL OPTIONS (allow_commit_timestamp=true),
  ...
) PRIMARY KEY (UserId, LastAccess);

Wie die folgende Tabelle mit den Zeilenschlüsseln und Zeilenschlüsselbereichen zeigt, wird ein Bereich durch das Pluszeichen "+" angezeigt. Der Schlüssel in diesen Fällen stellt den Startschlüssel eines Schlüsselbereichs dar, in dem ein Sperrkonflikt aufgetreten ist.

ROW_RANGE_START_KEY	Erklärung
Singers(2)	Tabelle "Singers" bei Schlüssel "SingerId=2"
Alben(2,1)	Album-Tabelle bei Schlüssel SingerId=2,AlbumId=1
Songs(2,1,5)	Tabelle "Songs" unter dem Schlüssel "SingerId=2,AlbumId=1,TrackId=5"
Songs(2,1,5+)	Schlüsselbereich der Songstabelle, beginnend bei SingerId=2,AlbumId=1,TrackId=5
Alben(2,1+)	Album-Tabellenschlüsselbereich ab SingerId=2,AlbumId=1
Nutzer(3, 2020-11-01 12:34:56.426426+00:00)	Nutzertabelle bei Schlüssel "UserId=3, LastAccess=commit_timestamp"

Zusammengefasste Statistiken

SPANNER_SYS enthält auch Tabellen zum Speichern aggregierter Daten für Sperrstatistiken, die von Spanner in einem bestimmten Zeitraum erfasst wurden:

SPANNER_SYS.LOCK_STATS_TOTAL_MINUTE: Zusammengefasste Statistiken für alle Sperrzeiten in 1-Minuten-Intervallen
SPANNER_SYS.LOCK_STATS_TOTAL_10MINUTE: Zusammengefasste Statistiken für alle Sperrzeiten in 10-Minuten-Intervallen
SPANNER_SYS.LOCK_STATS_TOTAL_HOUR: Zusammengefasste Statistiken für alle Sperrzeiten in 1-Stunden-Intervallen.

Zusammengefasste Statistiktabellen haben die folgenden Eigenschaften:

Jede Tabelle enthält Daten für nicht überlappende Zeitintervalle in der Länge, die der Tabellenname festlegt.
Die Intervalle beziehen sich auf die Uhrzeit. 1-Minuten-Intervalle enden nach einer vollen Minute, 10-Minuten-Intervalle enden alle 10 Minuten ab Beginn der vollen Stunde, 1-Stunden-Intervalle enden zu jeder vollen Stunde.

Zum Beispiel sind um 11:59:30 Uhr die neuesten Intervalle, die für SQL-Abfragen zu zusammengefassten Sperrstatistiken zur Verfügung stehen:
- 1 Minute: 11:58:00–11:58:59 Uhr
- 10 Minuten: 11:40:00–11:49:59 Uhr
- 1 Stunde: 10:00:00–10:59:59 Uhr
Jede Zeile enthält zusammengefasste Statistiken für alle Sperren der Datenbank während des angegebenen Intervalls. Es gibt nur je eine Zeile pro Zeitintervall.
Die in den SPANNER_SYS.LOCK_STATS_TOTAL_*-Tabellen erfassten Statistiken enthalten Sperren, die von Spanner nicht in den SPANNER_SYS.LOCK_STATS_TOP_*-Tabellen erfasst wurden.
Einige Spalten in diesen Tabellen werden als Messwerte in Cloud Monitoring verfügbar gemacht. Folgende Messwerte werden bereitgestellt:
- Wartezeit bei Sperren
Weitere Informationen finden Sie unter Spanner-Messwerte.

Tabellenschema

Spaltenname	Typ	Beschreibung
`INTERVAL_END`	`TIMESTAMP`	Ende des Zeitintervalls, in dem der Sperrkonflikt aufgetreten ist.
`TOTAL_LOCK_WAIT_SECONDS`	`FLOAT64`	Gesamtwartezeit für Sperrungen für Sperrkonflikte, die für die gesamte Datenbank aufgezeichnet wurden, in Sekunden.

Beispielabfragen

Das folgende Beispiel zeigt eine SQL-Anweisung, mit der Sie Sperrstatistiken abrufen können. Sie können diese SQL-Anweisungen mit den Clientbibliotheken, mit gcloud spanner oder mit der Google Cloud -Konsole ausführen.

Sperrstatistiken für den vorherigen 1-Minuten-Intervall auflisten

Die folgende Abfrage gibt die Informationen zur Sperre für jeden Zeilenschlüssel mit einem Sperrkonflikt zurück, einschließlich des Anteils der Gesamtsperrekonflikte während des letzten 1-Minuten-Zeitintervalls.

Die Funktion CAST() konvertiert das BYTES-Feld "row_range_start_key" in einen STRING.

SELECT CAST(s.row_range_start_key AS STRING) AS row_range_start_key,
       t.total_lock_wait_seconds,
       s.lock_wait_seconds,
       s.lock_wait_seconds/t.total_lock_wait_seconds frac_of_total,
       s.sample_lock_requests
FROM spanner_sys.lock_stats_total_minute t, spanner_sys.lock_stats_top_minute s
WHERE t.interval_end =
  (SELECT MAX(interval_end)
   FROM spanner_sys.lock_stats_total_minute)
AND s.interval_end = t.interval_end
ORDER BY s.lock_wait_seconds DESC;

Screenshot: Ausgabe der Abfrage

row_range_start_key	total_lock_wait_seconds	lock_wait_seconds	frac_of_total	sample_lock_requests
Songs(2,1,1)	2,37	1,76	0,7426	LOCK_MODE: ReaderShared SPALTE: Singers.SingerInfo LOCK_MODE: WriterShared Spalte: Singers.SingerInfo
Nutzer(3, 2020-11-01 12:34:56.426426+00:00)	2,37	0,61	0,2573	LOCK_MODE: ReaderShared SPALTE: users._exists¹ LOCK_MODE: WriterShared SPALTE: users._exists¹

row_range_start_key

total_lock_wait_seconds

lock_wait_seconds

frac_of_total

sample_lock_requests

Songs(2,1,1)

2,37

1,76

0,7426

LOCK_MODE: ReaderShared

SPALTE: Singers.SingerInfo

LOCK_MODE: WriterShared

Spalte: Singers.SingerInfo

Nutzer(3, 2020-11-01 12:34:56.426426+00:00)

2,37

0,61

0,2573

LOCK_MODE: ReaderShared

SPALTE: users._exists¹

LOCK_MODE: WriterShared

SPALTE: users._exists¹

¹ _exists ist ein internes Feld, mit dem geprüft wird, ob eine bestimmte Zeile vorhanden ist.

Datenaufbewahrung

Spanner speichert die Daten für jede Tabelle mindestens für die folgenden Zeiträume:

SPANNER_SYS.LOCK_STATS_TOP_MINUTE und SPANNER_SYS.LOCK_STATS_TOTAL_MINUTE: Intervalle der letzten 6 Stunden.
SPANNER_SYS.LOCK_STATS_TOP_10MINUTE und SPANNER_SYS.LOCK_STATS_TOTAL_10MINUTE: Intervalle der letzten 4 Tage.
SPANNER_SYS.LOCK_STATS_TOP_HOUR und SPANNER_SYS.LOCK_STATS_TOTAL_HOUR: Intervalle der letzten 30 Tage.

Fehlerbehebung bei Sperrkonflikten in Ihrer Datenbank mithilfe von Sperrstatistiken

Sie können SQL oder das Dashboard Sperrenstatistiken verwenden, um Sperrkonflikte in Ihrer Datenbank aufzurufen.

In den folgenden Themen wird gezeigt, wie Sie solche Sperrkonflikte mit SQL-Code untersuchen können.

Zeitraum für die Untersuchung auswählen

Sie untersuchen die Latenzmesswerte für Ihre Spanner-Datenbank und ermitteln einen Zeitraum, in dem Ihre Anwendung eine hohe Latenz und hohe CPU-Auslastung aufweist. Beispiel: Das Problem trat am 12. November 2020 um 22:50 Uhr auf.

Ermitteln, ob die Latenz des Transaktions-Commits zusammen mit der Wartezeit der Sperre während des ausgewählten Zeitraums erhöht wurde

Sperren werden von Transaktionen abgerufen. Wenn Sperrkonflikte lange Wartezeiten verursachen, sollten wir neben der Erhöhung der Wartezeit für die Sperre auch eine Erhöhung der Commit-Latenz der Transaktion erkennen können.

Nachdem ein Zeitraum zum Starten der Prüfung ausgewählt wurde, führen wir die Transaktionsstatistiken TXN_STATS_TOTAL_10MINUTE mit den Sperrstatistiken LOCK_STATS_TOTAL_10MINUTE zusammen, um uns bei der Ermittlung zu unterstützen, ob die Erhöhung der durchschnittlichen Commit-Latenz durch die Erhöhung der Wartezeit der Sperre ausgelöst wird.

SELECT t.interval_end, t.avg_commit_latency_seconds, l.total_lock_wait_seconds
FROM spanner_sys.txn_stats_total_10minute t
LEFT JOIN spanner_sys.lock_stats_total_10minute l
ON t.interval_end = l.interval_end
WHERE
  t.interval_end >= "2020-11-12T21:50:00Z"
  AND t.interval_end <= "2020-11-12T23:50:00Z"
ORDER BY interval_end;

Nehmen wir als Beispiel die folgenden Ergebnisse zu unserer Abfrage:

interval_end	avg_commit_latency_seconds	total_lock_wait_seconds
2020-11-12 21:40:00-07:00	0,002	0,090
2020-11-12 21:50:00-07:00	0,003	0,110
2020-11-12 22:00:00-07:00	0,002	0,100
2020-11-12 22:10:00-07:00	0,002	0,080
2020-11-12 22:20:00-07:00	0,030	0,240
2020-11-12 22:30:00-07:00	0,034	0,220
2020-11-12 22:40:00-07:00	0,034	0,218
2020-11-12 22:50:00-07:00	3,741	780,193
2020-11-12 23:00:00-07:00	0,042	0,240
2020-11-12 23:10:00-07:00	0,038	0,129
2020-11-12 23:20:00-07:00	0,021	0,128
2020-11-12 23:30:00-07:00	0,038	0,231

Die vorherigen Ergebnisse zeigen einen drastischen Anstieg von avg_commit_latency_seconds und total_lock_wait_seconds im selben Zeitraum von 12.11.2020, 22:40:00 Uhr, bis 12.11.2020, 22:50:00 Uhr, und danach gelöscht. Beachten Sie eine Möglichkeit: avg_commit_latency_seconds ist die durchschnittliche Zeit, die nur für den Commit-Schritt aufgewendet wird. total_lock_wait_seconds ist jedoch die zusammengefasste Sperrzeit für den Zeitraum, sodass die Zeit viel länger als die Commit-Zeit der Transaktion dauert.

Nachdem wir bestätigt haben, dass die Wartezeit der Sperre eng mit der Erhöhung der Schreiblatenz zusammenhängt, untersuchen wir im nächsten Schritt, welche Zeilen und Spalten die lange Wartezeit verursachen.

Ermitteln, welche Zeilenschlüssel und Spalten im ausgewählten Zeitraum lange Sperrzeiten hatten

Um herauszufinden, für welche Zeilenschlüssel und Spalten in dem von uns untersuchten Zeitraum die hohen Sperrzeiten aufgetreten sind, fragen wir dieLOCK_STAT_TOP_10MINUTE Table. Diese Tabelle enthält die Zeilenschlüssel und Spalten, die am meisten zum Sperren warten.

Die Funktion CAST() in der folgenden Abfrage wandelt das BYTES-Feld "row_range_start_key" in einen STRING um.

SELECT CAST(s.row_range_start_key AS STRING) AS row_range_start_key,
       t.total_lock_wait_seconds,
       s.lock_wait_seconds,
       s.lock_wait_seconds/t.total_lock_wait_seconds frac_of_total,
       s.sample_lock_requests
FROM spanner_sys.lock_stats_total_10minute t, spanner_sys.lock_stats_top_10minute s
WHERE
  t.interval_end = "2020-11-12T22:50:00Z" and s.interval_end = t.interval_end;

row_range_start_key	total_lock_wait_seconds	lock_wait_seconds	frac_of_total	sample_lock_requests
Singers(32)	780,193	780,193	1	LOCK_MODE: WriterShared SPALTE: Singers.SingerInfo LOCK_MODE: ReaderShared SPALTE: Singers.SingerInfo

row_range_start_key

total_lock_wait_seconds

lock_wait_seconds

frac_of_total

sample_lock_requests

Singers(32)

780,193

LOCK_MODE: WriterShared

SPALTE: Singers.SingerInfo

LOCK_MODE: ReaderShared

SPALTE: Singers.SingerInfo

In dieser Ergebnistabelle sehen Sie, dass der Konflikt in der Tabelle Singers unter dem Schlüssel SingerId=32 aufgetreten ist. Die Singers.SingerInfo ist die Spalte, in der der Sperrkonflikt zwischen ReaderShared und WriterShared aufgetreten ist.

Dies ist ein häufiger Konflikttyp, wenn eine Transaktion versuchen, eine bestimmte Zelle zu lesen, und die andere Transaktion versucht, in dieselbe Zelle zu schreiben. Wir kennen jetzt die genaue Datenzelle, für die die Transaktionen die Sperre konkurrieren, sodass wir im nächsten Schritt die Transaktionen ermitteln, die um die Sperren konkurriert.

Herausfinden, welche Transaktionen auf die Spalten zugreifen, die am Sperrkonflikt beteiligt sind

Wenn Sie die Transaktionen ermitteln möchten, bei denen es aufgrund von Sperrkonflikten in einem bestimmten Zeitintervall zu einer erheblichen Commit-Latenz kommt, müssen Sie die folgenden Spalten aus der Tabelle SPANNER_SYS.TXN_STATS_TOTAL_10MINUTE abfragen:

fprint
read_columns
write_constructive_columns
avg_commit_latency_seconds

Sie müssen nach gesperrten Spalten filtern, die in der Tabelle SPANNER_SYS.LOCK_STATS_TOP_10MINUTE angegeben sind:

Transaktionen, die eine Spalte lesen, bei der beim Abrufen der Sperre ReaderShared ein Sperrkonflikt aufgetreten ist.
Transaktionen, die in eine Spalte schreiben, die während des Versuchs, eine WriterShared-Sperre zu erhalten, in Konflikt steht.

SELECT
  fprint,
  read_columns,
  write_constructive_columns,
  avg_commit_latency_seconds
FROM spanner_sys.txn_stats_top_10minute t2
WHERE (
  EXISTS (
    SELECT * FROM t2.read_columns columns WHERE columns IN (
      SELECT DISTINCT(req.COLUMN)
      FROM spanner_sys.lock_stats_top_10minute t, t.SAMPLE_LOCK_REQUESTS req
      WHERE req.LOCK_MODE = "ReaderShared" AND t.interval_end ="2020-11-12T23:50:00Z"))
OR
  EXISTS (
    SELECT * FROM t2.write_constructive_columns columns WHERE columns IN (
      SELECT DISTINCT(req.COLUMN)
      FROM spanner_sys.lock_stats_top_10minute t, t.SAMPLE_LOCK_REQUESTS req
      WHERE req.LOCK_MODE = "WriterShared" AND t.interval_end ="2020-11-12T23:50:00Z"))
)
AND t2.interval_end ="2020-11-12T23:50:00Z"
ORDER BY avg_commit_latency_seconds DESC;

Das Abfrageergebnis wird nach der Spalte avg_commit_latency_seconds sortiert, sodass die Transaktion mit der höchsten Commit-Latenz zuerst angezeigt wird.

fprint	read_columns	write_constructive_columns	avg_commit_latency_seconds
1866043996151916800	['Singers.SingerInfo', 'Singers.FirstName', 'Singers.LastName', 'Singers._exists']	['Singers.SingerInfo']	4,89
4168578515815911936	[]	['Singers.SingerInfo']	3,65

Die Abfrageergebnisse zeigen, dass zwei Transaktionen versucht haben, auf die Spalte Singers.SingerInfo zuzugreifen. Dies ist die Spalte, in der während des Zeitraums Sperrkonflikte aufgetreten sind. Sobald Sie die Transaktionen identifiziert haben, die die Sperrkonflikte verursachen, können Sie die Transaktionen mit ihrem Fingerabdruck (fprint) analysieren, um potenzielle Probleme zu identifizieren, die zu dem Sperrkonflikt beigetragen haben.

Nachdem Sie die Transaktion mit fprint=1866043996151916800 überprüft haben, können Sie anhand der Spalten read_columns und write_constructive_columns ermitteln, welcher Teil Ihres Anwendungscodes die Transaktion ausgelöst hat. Anschließend können Sie die zugrunde liegende DML ansehen, die nicht nach dem Primärschlüssel SingerId gefiltert wird. Daher wurde ein vollständiger Tabellenscan durchgeführt und die Tabelle gesperrt, bis die Transaktion festgeschrieben wurde.

So beheben Sie den Sperrkonflikt:

Verwenden Sie eine schreibgeschützte Transaktion, um die erforderlichen SingerId-Werte zu ermitteln.
Verwenden Sie eine separate Lese-/Schreibtransaktion, um die Zeilen für die erforderlichen SingerId-Werte zu aktualisieren.

Best Practices zur Reduzierung von Sperrkonflikten anwenden

In unserem Beispielszenario konnten wir Sperrstatistiken und Transaktionsstatistiken verwenden, um unser Problem auf eine Transaktion einzugrenzen, die nicht den Primärschlüssel unserer Tabelle bei Aktualisierungen verwendet hat. Wir haben Ideen zur Verbesserung der Transaktion entwickelt, die darauf basiert, ob wir die Schlüssel der Zeilen, die wir aktualisieren möchten, schon vorher kennen konnten.

Beachten Sie diese Best Practices, um die Anzahl von Sperrkonflikten in Ihrer Datenbank zu reduzieren, wenn Sie potenzielle Probleme in Ihrer Lösung betrachten oder auch beim Entwerfen Ihrer Lösung.

Große Lesevorgänge in Lese-Schreib-Transaktionen vermeiden.
Verwenden Sie nach Möglichkeit schreibgeschützte Transaktionen, da sie keine Sperren abrufen.
Vermeiden Sie vollständige Tabellenscans in einer Lese-Schreib-Transaktion. Dazu gehört das Schreiben einer DML-Bedingung für den Primärschlüssel oder die Zuweisung eines bestimmten Schlüsselbereichs bei Verwendung der Lese-API.
Halten Sie den Sperrzeitraum kurz, indem Sie die Änderung kurz nach dem Lesen der Daten in einer Lese-Schreib-Transaktion festschreiben. Eine Lese-/Schreibtransaktion garantiert, dass die Daten nach dem Lesen der Daten unverändert bleiben, bis Sie die Änderung erfolgreich übergeben. Zu diesem Zweck sperrt die Transaktion die Datenzellen während des Lese- und des Commit-Vorgangs. Wenn Sie die Sperrdauer kurz halten, treten bei Transaktionen weniger Sperrkonflikte auf.
Bevorzugen Sie kleine Transaktionen gegenüber großen Transaktionen oder partitionierte DML für lang andauernde DML-Transaktionen. Eine lang andauernde Transaktion erwirbt eine Sperre für eine lange Zeit. Daher sollten Sie in Betracht ziehen, eine Transaktion, die Tausende von Zeilen betreffen, in mehrere kleinere Transaktionen aufzuteilen, die nach Möglichkeit hunderte Zeilen aktualisieren.
Wenn Sie die von einer Lese-Schreib-Transaktion bereitgestellte Garantie nicht benötigen, sollten Sie vor dem Commit der Änderung keine Daten in der Lese-Schreib-Transaktion lesen, z. B. durch Lesen der Daten in einer separaten schreibgeschützten Transaktion. Die meisten Sperrkonflikte treten aufgrund der starken Garantie auf, um sicherzustellen, dass die Daten zwischen dem Lese- und Commit unverändert bleiben. Wenn also die Lese-/Schreibtransaktion keine Daten liest, muss die Zelle für längere Zeit nicht gesperrt werden.
Geben Sie nur die Mindestanzahl an Spalten an, die für eine Lese-/Schreibtransaktion erforderlich sind. Da Spanner-Sperren pro Datenzelle gelten, wird bei einer Lese-/Schreibtransaktion, bei der zu viele Spalten gelesen werden, eine ReaderShared-Sperre für diese Zellen abgerufen. Dies kann zu Sperrkonflikten führen, wenn andere Transaktionen eine WriterShared-Sperre für Schreibvorgänge in die zusätzlichen Spalten erhalten. Geben Sie beispielsweise beim Lesen eine Reihe von Spalten anstelle von * an.
Minimieren Sie die Anzahl der API-Aufrufe in einer Lese-Schreib-Transaktion. Die Latenz von API-Aufrufen kann zu Konflikten bei der Sperrung in Spanner führen, da API-Aufrufe sowohl Netzwerk- als auch dienstseitigen Verzögerungen unterliegen. Wir empfehlen, API-Aufrufe nach Möglichkeit außerhalb von Lese-/Schreibtransaktionen auszuführen. Wenn Sie API-Aufrufe in einer Lese-/Schreibtransaktion ausführen müssen, sollten Sie die Latenz Ihrer API-Aufrufe im Blick behalten, um die Auswirkungen auf den Zeitraum zu minimieren, in dem die Sperre abgerufen wird.
Orientieren Sie sich an den Best Practices für Schemadesign.

Nächste Schritte

Weitere Informationen zu Tools zur Selbstbeobachtung
Weitere Informationen zu den Informationen, die Spanner für jede Datenbank in der Informationsschematabelle der Datenbank speichert
SQL-Best-Practices für Spanner