Questa pagina illustra le transazioni in Spanner e include codice campione per l'esecuzione delle transazioni.
Introduzione
Una transazione in Spanner è un insieme di letture e scritture che vengono eseguite in modo atomico in un singolo punto logico nel tempo su colonne, righe e tabelle di un database.
Spanner supporta le seguenti modalità di transazione:
Blocco lettura/scrittura. Queste transazioni si basano su blocchi pessimistici e, se necessario, su commit a due fasi. Il blocco delle transazioni di lettura/scrittura potrebbe essere interrotto, richiedono all'applicazione di riprovare.
Di sola lettura. Questo tipo di transazione garantisce la coerenza su più letture, ma non consente le scritture. Per impostazione predefinita, le transazioni di sola lettura vengono eseguite in base a un timestamp scelto dal sistema che garantisce la coerenza esterna, ma possono anche essere configurate per la lettura in base a un timestamp passato. Le transazioni di sola lettura non devono essere confermate e non richiedono blocchi. Inoltre, le transazioni di sola lettura potrebbero attendere il completamento delle scritture in corso prima di essere eseguite.
DML partizionato. Questo tipo di transazione esegue un'istruzione Data Manipulation Language (DML) come DML partizionata. Il DML partizionato è progettato per aggiornamenti ed eliminazioni collettivi, in particolare per la pulizia e il backfill periodici. Se devi eseguire il commit di un numero elevato di scrittura cieche, ma non hai bisogno di una transazione atomica, puoi modificare collettivamente le tue tabelle Spanner utilizzando la scrittura batch. Per ulteriori informazioni, consulta la sezione Modificare i dati utilizzando le scritture batch.
Questa pagina descrive le proprietà generali e la semantica delle transazioni in Spanner e illustra le interfacce delle transazioni DML partizionate, di lettura-scrittura e di sola lettura in Spanner.
Transazioni di lettura/scrittura
Di seguito sono riportati gli scenari in cui è consigliabile utilizzare una transazione di lettura/scrittura con blocco:
- Se esegui una scrittura che dipende dal risultato di una o più letture, devi eseguire la scrittura e le letture nella stessa transazione di lettura/scrittura.
- Esempio: raddoppia il saldo del conto bancario A. La lettura del saldo di A deve essere nella stessa transazione della scrittura per sostituire il saldo con il valore raddoppiato.
- Se esegui una o più scritture che devono essere committate in modo atomico, devi eseguire queste scritture nella stessa transazione di lettura/scrittura.
- Esempio: trasferisci 200 $dall'account A all'account B. Entrambe le scritture (una per diminuire A di 200 $e una per aumentare B di 200 $) e le letture dei saldi iniziali degli account devono trovarsi nella stessa transazione.
- Se potresti eseguire una o più scritture, a seconda dei risultati di una o più letture, devi eseguire queste scritture e letture nella stessa transazione di lettura/scrittura, anche se le scritture non vengono eseguite.
- Esempio: trasferisci 200 $dal conto bancario A al conto bancario B se il saldo corrente di A è superiore a 500 $. La transazione deve contenere una lettura del saldo di A e un'istruzione condizionale che contenga le scritture.
Ecco uno scenario in cui non devi utilizzare una transazione di lettura/scrittura con blocco:
- Se esegui solo letture e puoi esprimerle utilizzando un metodo di lettura singolo, devi utilizzare questo metodo o una transazione di sola lettura. Le letture singole non vengono bloccate, diversamente dalle transazioni di lettura/scrittura.
Proprietà
Una transazione di lettura-scrittura in Spanner esegue un insieme di letture e scritture in modo atomico in un singolo punto di tempo logico. Inoltre, il timestamp al quale vengono eseguite le transazioni di lettura/scrittura corrisponde all'ora del sistema operativo e l'ordine di serializzazione corrisponde all'ordine dei timestamp.
Perché utilizzare una transazione di lettura/scrittura? Le transazioni di lettura/scrittura forniscono le proprietà ACID dei database relazionali (infatti, le transazioni di lettura/scrittura di Spanner offrono garanzie ancora più solide rispetto all'ACID tradizionale; consulta la sezione Semantica di seguito).
Isolamento
Di seguito sono riportate le proprietà di isolamento per le transazioni di lettura/scrittura e di sola lettura.
Transazioni di lettura e scrittura
Di seguito sono riportate le proprietà di isolamento che ottieni dopo aver eseguito il commit di una transazione contenente una serie di letture (o query) e scritture:
- Tutte le letture all'interno della transazione hanno restituito valori che riflettono uno snapshot coerente acquisito al timestamp di commit della transazione.
- Le righe o gli intervalli vuoti sono rimasti tali al momento del commit.
- Tutte le scritture all'interno della transazione sono state committate al timestamp del commit della transazione.
- Le scritture non erano visibili a nessuna transazione fino al commit della transazione.
Alcuni driver client Spanner contengono una logica di ripetizione delle transazioni per mascherare gli errori temporanei, eseguendo nuovamente la transazione e convalidando i dati osservati dal client.
Il risultato è che tutte le letture e le scritture sembrano essere avvenute in un unico momento, sia dal punto di vista della transazione stessa sia dal punto di vista di altri lettori e scrittori del database Spanner. In altre parole, le letture e le scritture finiscono per verificarsi nello stesso timestamp (vedi un'illustrazione di questo nella sezione Serializzabilità e coerenza esterna di seguito).
Transazioni di sola lettura
Le garanzie per una transazione di lettura/scrittura che esegue solo letture sono simili: tutte le letture all'interno della transazione restituiscono i dati dello stesso timestamp, anche per le righe non esistenti. Una differenza è che se leggi i dati e poi esegui il commit della transazione di lettura/scrittura senza scritture, non è garantito che i dati non siano cambiati nel database dopo la lettura e prima del commit. Se vuoi sapere se i dati sono cambiati dall'ultima lettura, l'approccio migliore è leggerli di nuovo (in una transazione di lettura/scrittura o utilizzando una lettura sicura). Inoltre, per motivi di efficienza, se sai in anticipo che leggerai solo e non scriverai, devi utilizzare una transazione di sola lettura anziché una transazione di lettura/scrittura.
Atomicità, coerenza, durabilità
Oltre alla proprietà Isolamento, Spanner offre atomicità (se una delle scritture nella transazione viene eseguita, vengono eseguite tutte), coerenza (il database rimane in uno stato coerente dopo la transazione) e durabilità (i dati committati rimangono tali).
Vantaggi di queste proprietà
Grazie a queste proprietà, in qualità di sviluppatore di applicazioni, puoi concentrarti sulla correttezza di ogni transazione singolarmente, senza preoccuparti di come proteggerne l'esecuzione da altre transazioni che potrebbero essere eseguite contemporaneamente.
Interfaccia
Le librerie client Spanner forniscono un'interfaccia per l'esecuzione di un corpo di lavoro nel contesto di una transazione di lettura-scrittura, con tentativi di nuovo invio per gli aborti della transazione. Ecco un po' di contesto per spiegare questo punto: potrebbe essere necessario provare una transazione Spanner più volte prima di eseguire il commit. Ad esempio, se due transazioni tentano di lavorare contemporaneamente sui dati in un modo che potrebbe causare un blocco, Spanner ne interrompe una in modo che l'altra transazione possa avanzare. Più raramente, gli eventi transitori all'interno di Spanner possono provocare l'interruzione di alcune transazioni. Poiché le transazioni sono atomiche, una transazione abortita non ha alcun effetto visibile sul database. Pertanto, le transazioni devono essere eseguite tentando di nuovo finché non vanno a buon fine.
Quando utilizzi una transazione in una libreria client Spanner, definisci il corpo di una transazione (ovvero le letture e le scritture da eseguire su una o più tabelle di un database) sotto forma di oggetto funzione. Dietro le quinte, la libreria client di Spanner esegue la funzione ripetutamente fino al commit della transazione o all'incontro di un errore non ripetibile.
Esempio
Supponiamo che tu abbia aggiunto una colonna MarketingBudget
alla tabella
Albums
mostrata nella pagina Schema e modello di dati:
CREATE TABLE Albums ( SingerId INT64 NOT NULL, AlbumId INT64 NOT NULL, AlbumTitle STRING(MAX), MarketingBudget INT64 ) PRIMARY KEY (SingerId, AlbumId);
Il reparto marketing decide di fare una spinta di marketing per l'album associato a Albums (1, 1)
e ti chiede di trasferire 200.000 $dal budget di Albums
(2, 2)
, ma solo se i fondi sono disponibili nel budget dell'album. Per questa operazione, devi utilizzare una transazione di lettura/scrittura con blocco, perché la transazione potrebbe eseguire scritture a seconda del risultato di una lettura.
Di seguito viene mostrato come eseguire una transazione di lettura/scrittura:
C++
C#
Vai
Java
Node.js
PHP
Python
Ruby
Semantica
Serializzabilità e coerenza esterna
Spanner offre la "serializzabilità", il che significa che tutte le transazioni sembrano essere state eseguite in un ordine seriale, anche se alcune letture, scritture e altre operazioni di transazioni distinte sono effettivamente avvenute in parallelo. Spanner assegna timestamp dei commit che riflettono l'ordine delle transazioni committate per implementare questa proprietà. In effetti, Spanner offre una garanzia più solida della serializzabilità chiamata coerenza esterna: le transazioni vengono committate in un ordine che si riflette nei relativi timestamp di commit e questi timestamp di commit riflettono il tempo reale, quindi puoi confrontarli con il tuo orologio. Le letture in una transazione vedono tutto ciò che è stato eseguito prima del commit della transazione, mentre le scritture vengono visualizzate da tutto ciò che inizia dopo il commit della transazione.
Ad esempio, considera l'esecuzione di due transazioni come illustrato nel diagramma di seguito:
La transazione Txn1
in blu legge alcuni dati A
, memorizza una scrittura in A
e poi
viene eseguita correttamente. La transazione Txn2
in verde inizia dopo Txn1
, legge alcuni dati B
, quindi legge i dati A
. Poiché Txn2
legge il valore di A
dopo che Txn1
ha eseguito il commit della scrittura in A
, Txn2
vede l'effetto della scrittura di Txn1
in A
, anche se Txn2
è stato avviato prima del completamento di Txn1
.
Anche se esiste una certa sovrapposizione temporale in cui Txn1
e Txn2
vengono eseguiti, i relativi timestamp di commit c1
e c2
rispettano un ordine di transazioni lineare, il che significa che tutti gli effetti delle letture e delle scritture di Txn1
sembrano essere avvenuti in un unico punto nel tempo (c1
) e tutti gli effetti delle letture e delle scritture di Txn2
sembrano essere avvenuti in un unico punto nel tempo (c2
). Inoltre, c1 < c2
(che è garantito perché sia Txn1
che Txn2
hanno eseguito commit delle scritture; questo è vero anche se le scritture sono avvenute su macchine diverse), che rispetta l'ordine di Txn1
che avviene prima di Txn2
.
Tuttavia, se Txn2
ha eseguito solo letture nella transazione, c1 <= c2
.
Le letture osservano un prefisso della cronologia dei commit. Se una lettura vede l'effetto di Txn2
, vede anche l'effetto di Txn1
. Tutte le transazioni che vengono committate
con successo hanno questa proprietà.
Garanzie di lettura e scrittura
Se una chiamata per eseguire una transazione non va a buon fine, le garanzie di lettura e scrittura di cui disponi dipendono dall'errore con cui non è riuscita la chiamata di commit sottostante.
Ad esempio, un errore come "Riga non trovata" o "Riga già esistente" indica che la scrittura delle mutazioni in buffer ha riscontrato un errore, ad esempio una riga che il cliente sta tentando di aggiornare non esiste. In questo caso, le letture sono garantite come coerenti, le scritture non vengono applicate e la non esistenza della riga è garantita come coerente anche con le letture.
Annullamento delle operazioni di transazione
Le operazioni di lettura asincrona possono essere annullate in qualsiasi momento dall'utente (ad es. quando viene annullata un'operazione di livello superiore o decidi di interrompere una lettura in base ai risultati iniziali ricevuti dalla lettura) senza influire su altre operazioni esistenti all'interno della transazione.
Tuttavia, anche se hai tentato di annullare la lettura, Spanner non garantisce che la lettura sia effettivamente annullata. Dopo aver richiesto l'annullamento di una lettura, la lettura può comunque essere completata o non riuscire per un altro motivo (ad es. Abort). Inoltre, la lettura annullata potrebbe effettivamente restituirti alcuni risultati, che verranno convalidati nell'ambito del commit della transazione.
Tieni presente che, a differenza delle letture, l'annullamento di un'operazione di commit della transazione comporterà l'interruzione della transazione (a meno che non sia già stato eseguito il commit della transazione o se non sia riuscita per un altro motivo).
Prestazioni
Chiusura
Spanner consente a più client di interagire contemporaneamente con lo stesso database. Per garantire la coerenza di più transazioni contemporaneamente, Spanner utilizza una combinazione di blocchi condivisi e blocchi esclusivi per controllare l'accesso ai dati. Quando esegui una lettura nell'ambito di una transazione, Spanner acquisisce blocchi di lettura condivisi, che consentono ad altre letture di accedere comunque ai dati fino a quando la transazione non è pronta per l'commit. Quando viene eseguito il commit della transazione e vengono applicate le scritture, la transazione tenta di eseguire l'upgrade a un blocco esclusivo. Blocca i nuovi blocchi di lettura condivisi sui dati, attende che i blocchi di lettura condivisi esistenti vengano cancellati e poi inserisce un blocco esclusivo per l'accesso esclusivo ai dati.
Note sulle serrature:
- I blocchi vengono presi con la granularità di riga e colonna. Se la transazione T1 ha bloccato la colonna "A" della riga "foo" e la transazione T2 vuole scrivere nella colonna "B" della riga "foo", non esiste alcun conflitto.
- Le scritture in un elemento dati che non leggono anche i dati in fase di scrittura (ovvero le "scritture blind") non sono in conflitto con altre scritture blind dello stesso elemento (il timestamp del commit di ogni scrittura determina l'ordine in cui viene applicata al database). Di conseguenza, Spanner deve eseguire l'upgrade a un blocco esclusivo solo se hai letto i dati che stai scrivendo. In caso contrario, Spanner utilizza un blocco condiviso chiamato blocco condiviso per gli autori.
- Quando esegui ricerche di righe all'interno di una transazione di lettura/scrittura, utilizza indici secondari per limitare le righe scandite a un intervallo più piccolo. In questo modo, Spanner blocca un numero minore di righe nella tabella, consentendo la modifica simultanea delle righe al di fuori dell'intervallo.
I blocchi non devono essere utilizzati per garantire l'accesso esclusivo a una risorsa esterna a Spanner. Le transazioni possono essere interrotte da Spanner per diversi motivi, ad esempio quando si consente il trasferimento dei dati tra le risorse di calcolo dell'istanza. Se viene eseguito un nuovo tentativo per una transazione, esplicitamente tramite il codice dell'applicazione o implicitamente tramite il codice client come il driver JDBC Spanner, viene garantito solo che le chiavi sono state mantenute durante il tentativo che ha effettivamente eseguito il commit.
Puoi utilizzare lo strumento di introspezione Statistiche sui blocchi per esaminare i conflitti di blocco nel database.
Rilevamento di deadlock
Spanner rileva quando più transazioni potrebbero essere in stato di deadlock e forza l'interruzione di tutte le transazioni tranne una. Ad esempio, considera il seguente scenario: la transazione Txn1
detiene un blocco sul record A
ed è in attesa di un blocco sul record B
, mentre Txn2
detiene un blocco sul record B
ed è in attesa di un blocco sul record A
. L'unico modo per avanzare in questa situazione è interrompere una delle transazioni in modo da rilasciare il blocco e consentire l'avanzamento dell'altra transazione.
Spanner utilizza l'algoritmo standard "wound-wait" per gestire il rilevamento dei deadlock. Dietro le quinte, Spanner tiene traccia dell'età di ogni transazione che richiede blocchi in conflitto. Consente inoltre alle transazioni meno recenti di abortire quelle più recenti (dove "meno recenti" indica che la lettura, la query o il commit più antichi della transazione sono avvenuti prima).
Dando la priorità alle transazioni precedenti, Spanner garantisce che ogni transazione abbia la possibilità di acquisire i blocchi alla fine, quando diventa abbastanza vecchia da avere una priorità più alta rispetto alle altre transazioni. Ad esempio, una transazione che acquisisce un blocco condiviso per i lettori può essere interrotta da una transazione precedente che richiede un blocco condiviso per gli autori.
Esecuzione distribuita
Spanner può eseguire transazioni su dati che si estendono su più server. Questa potenza comporta un costo in termini di prestazioni rispetto alle transazioni su un singolo server.
Quali tipi di transazioni potrebbero essere distribuite? Dietro le quinte, Spanner può suddividere la responsabilità per le righe del database su più server. Una riga e le righe corrispondenti nelle tabelle interlacciate vengono solitamente servite dallo stesso server, così come due righe nella stessa tabella con chiavi vicine. Spanner può eseguire transazioni su righe su server diversi. Tuttavia, come regola generale, le transazioni che interessano molte righe colocate sono più veloci ed economiche rispetto alle transazioni che interessano molte righe sparse nel database o in una tabella di grandi dimensioni.
Le transazioni più efficienti in Spanner includono solo le letture e le scritture che devono essere applicate in modo atomico. Le transazioni sono più veloci quando tutte le letture e le scritture accedono ai dati nella stessa parte dello spazio delle chiavi.
Transazioni di sola lettura
Oltre a bloccare le transazioni di lettura-scrittura, Spanner offre anche transazioni di sola lettura.
Utilizza una transazione di sola lettura quando devi eseguire più letture allo stesso timestamp. Se puoi esprimere la lettura utilizzando uno dei metodi di lettura singola di Spanner, devi utilizzare questo metodo di lettura singola. Il rendimento dell'utilizzo di una singola chiamata di lettura dovrebbe essere paragonabile al rendimento di una singola lettura eseguita in una transazione di sola lettura.
Se stai leggendo una grande quantità di dati, valuta la possibilità di utilizzare le partizioni per leggere i dati in parallelo.
Poiché le transazioni di sola lettura non scrivono, non trattengono i blocchi e non bloccano altre transazioni. Le transazioni di sola lettura osservano un prefisso coerente della cronologia dei commit delle transazioni, in modo che la tua applicazione riceva sempre dati coerenti.
Proprietà
Una transazione di sola lettura di Spanner esegue un insieme di letture in un singolo momento logico, sia dal punto di vista della transazione di sola lettura in sé sia dal punto di vista di altri lettori e scrittori del database Spanner. Ciò significa che le transazioni di sola lettura osservano sempre uno stato coerente del database in un punto scelto della cronologia delle transazioni.
Interfaccia
Spanner fornisce un'interfaccia per l'esecuzione di un insieme di attività nel contesto di una transazione di sola lettura, con tentativi di nuovo invio per gli aborti delle transazioni.
Esempio
Di seguito viene mostrato come utilizzare una transazione di sola lettura per ottenere dati coerenti per due letture nello stesso timestamp:
C++
C#
Vai
Java
Node.js
PHP
Python
Ruby
Transazioni DML partizionate
Utilizzando il linguaggio di manipolazione dei dati partizionato (DML partizionato), puoi eseguire istruzioni UPDATE
e DELETE
su larga scala senza incorrere in limiti di transazioni o bloccare un'intera tabella.
Spanner partiziona lo spazio delle chiavi ed esegue gli enunciati DML su ogni
partizione in una transazione di lettura-scrittura separata.
Esegui istruzioni DML in transazioni di lettura/scrittura che crei esplicitamente nel codice. Per ulteriori informazioni, consulta la sezione Utilizzare DML.
Proprietà
Puoi eseguire una sola istruzione DML partizionata alla volta, indipendentemente dall'utilizzo di un metodo della libreria client o di Google Cloud CLI.
Le transazioni partizionate non supportano il commit o il rollback. Spanner esegue e applica immediatamente l'istruzione DML. Se annulli l'operazione o se questa non va a buon fine, Spanner annulla tutte le partizioni in esecuzione e non avvia nessuna delle partizioni rimanenti. Spanner non esegue il rollback delle partizioni già eseguite.
Interfaccia
Spanner fornisce un'interfaccia per l'esecuzione di un singolo statement DML partitioned.
Esempi
Il seguente esempio di codice aggiorna la colonna MarketingBudget
della tabella Albums
.
C++
Utilizza la funzione ExecutePartitionedDml()
per eseguire un'istruzione DML partizionata.
C#
Utilizza il metodo ExecutePartitionedUpdateAsync()
per eseguire un'istruzione DML partizionata.
Vai
Utilizza il metodo PartitionedUpdate()
per eseguire un'istruzione DML partizionata.
Java
Utilizza il metodo executePartitionedUpdate()
per eseguire un'istruzione DML partizionata.
Node.js
Utilizza il metodo runPartitionedUpdate()
per eseguire un'istruzione DML partizionata.
PHP
Utilizza il metodo executePartitionedUpdate()
per eseguire un'istruzione DML partizionata.
Python
Utilizza il metodo execute_partitioned_dml()
per eseguire un'istruzione DML partizionata.
Ruby
Utilizza il metodo execute_partitioned_update()
per eseguire un'istruzione DML partizionata.
L'esempio di codice seguente elimina le righe dalla tabella Singers
in base alla colonna SingerId
.