Questa pagina illustra le transazioni in Spanner e include codice di esempio per l'esecuzione delle transazioni.
Introduzione
Una transazione in Spanner è un insieme di letture e scritture che vengono eseguite in modo atomico in un singolo punto logico nel tempo su colonne, righe e tabelle di un database.
Spanner supporta queste modalità di transazione:
Blocco lettura/scrittura. Queste transazioni si basano su blocchi pessimistici e, se necessario, su commit a due fasi. Il blocco delle transazioni di lettura/scrittura potrebbe essere interrotto, richiedono all'applicazione di riprovare.
Sola lettura. Questo tipo di transazione offre coerenza garantita tra diverse letture, ma non consente scritture. Per impostazione predefinita, le transazioni di sola lettura vengono eseguite in base a un timestamp scelto dal sistema che garantisce la coerenza esterna, ma possono anche essere configurate per la lettura in base a un timestamp passato. Le transazioni di sola lettura non devono essere confermate e non richiedono blocchi. Inoltre, le transazioni di sola lettura potrebbero attendere il completamento delle scritture in corso prima di essere eseguite.
DML partizionato. Questo tipo di transazione esegue un'istruzione Data Manipulation Language (DML) come DML partizionata. Il DML partizionato è progettato per aggiornamenti ed eliminazioni collettivi, in particolare per la pulizia e il backfill periodici. Se devi eseguire il commit scritture cieche, ma non richiedono una transazione atomica, puoi eseguire modifiche collettive e scrivere in batch. Per ulteriori informazioni, consulta la sezione Modificare i dati utilizzando le scritture collettive.
Questa pagina descrive le proprietà generali e la semantica delle transazioni in Spanner e introduce il DML partizionato, di sola lettura e lettura di transazioni in Spanner.
Transazioni di lettura/scrittura
Di seguito sono riportati gli scenari in cui è consigliabile utilizzare una transazione di lettura/scrittura con blocco:
- Se esegui una scrittura che dipende dal risultato di una o più letture, devi eseguire la scrittura e le letture nella stessa transazione di lettura/scrittura.
- Esempio: il doppio del saldo del conto bancario A. La lettura del saldo di A deve essere nella stessa transazione della scrittura per sostituire il saldo con il valore raddoppiato.
- Se esegui una o più scritture che devono essere eseguite atomicamente,
eseguire queste scritture nella stessa transazione di lettura/scrittura.
- Esempio: trasferisci 200 € dall'account A all'account B. Entrambe le scritture (una per diminuire A di 200 $ e una per aumentare B di 200 $) e le letture dei saldi iniziali degli account devono trovarsi nella stessa transazione.
- Se potresti eseguire una o più scritture, a seconda dei risultati di una o più letture, devi eseguire queste scritture e letture nella stessa transazione di lettura/scrittura, anche se le scritture non vengono eseguite.
- Esempio: trasferisci 200 $dal conto bancario A al conto B se è A il saldo attuale è superiore a 500 $. La transazione deve contenere una lettura del saldo di A e un'istruzione condizionale che contenga le scritture.
Ecco uno scenario in cui non dovresti utilizzare un sistema di lettura e scrittura di blocco transazione:
- Se esegui solo letture e puoi esprimere la lettura utilizzando un metodo di lettura singola, devi utilizzare il singolo metodo di lettura o una transazione di sola lettura. Le letture singole non vengono bloccate, diversamente dalle transazioni di lettura/scrittura.
Proprietà
Una transazione di lettura/scrittura in Spanner esegue un insieme di operazioni di lettura e scrittura atomicamente in un singolo punto logico nel tempo. Inoltre, il timestamp at le transazioni di lettura/scrittura eseguite corrispondono alle ore effettive, l'ordine di serializzazione corrisponde all'ordine del timestamp.
Perché utilizzare una transazione di lettura/scrittura? Le transazioni di lettura/scrittura forniscono le proprietà ACID dei database relazionali (infatti, le transazioni di lettura/scrittura di Spanner offrono garanzie ancora più solide rispetto all'ACID tradizionale; consulta la sezione Semantica di seguito).
Isolamento
Di seguito sono riportate le proprietà di isolamento per le transazioni di lettura/scrittura e di sola lettura.
Transazioni di lettura e scrittura
Ecco le proprietà di isolamento che ottieni dopo il commit di una transazione che contiene una serie di letture (o query) e scritture:
- Tutte le letture all'interno della transazione hanno restituito valori che riflettono uno snapshot coerente acquisito al timestamp di commit della transazione.
- Le righe o gli intervalli vuoti sono rimasti tali al momento del commit.
- Tutte le scritture all'interno della transazione sono state impegnate a livello di di commit.
- Le scritture non erano visibili in nessuna transazione prima della transazione impegnato.
Alcuni driver client Spanner contengono logica per i nuovi tentativi delle transazioni da mascherare errori temporanei, che si verificano eseguendo di nuovo la transazione e convalidando osservati dal cliente.
Il risultato è che tutte le operazioni di lettura e scrittura sembrano essere avvenute in un singolo momento specifico, sia dal punto di vista della transazione stessa sia il punto di vista di altri lettori e scrittori al database Spanner. Nella altre parole, le letture e le scritture finiscono per verificarsi allo stesso timestamp (per un'illustrazione, consulta la sezione Serializzabilità e coerenza di seguito).
Transazioni di sola lettura
Le garanzie di una transazione di lettura/scrittura che si limitano a operazioni di lettura sono simili: le letture all'interno della transazione restituiscono i dati dello stesso timestamp, anche per le righe inesistente. Una differenza è che se leggi i dati e poi esegui il commit della transazione di lettura/scrittura senza scritture, non è garantito che i dati non siano cambiati nel database dopo la lettura e prima del commit. Se vuoi sapere se i dati sono cambiati dall'ultima lettura, l'approccio migliore è leggerli di nuovo (in una transazione di lettura/scrittura o utilizzando una lettura sicura). Inoltre, per motivi di efficienza, se sai in anticipo che leggerai solo e non scriverai, devi utilizzare una transazione di sola lettura anziché una transazione di lettura/scrittura.
Atomicità, coerenza, durabilità
Oltre alla proprietà Isolamento, Spanner offre atomicità (se una delle scritture nella transazione viene eseguita, vengono eseguite tutte), coerenza (il database rimane in uno stato coerente dopo la transazione) e durabilità (i dati committati rimangono tali).
Vantaggi di queste strutture
Grazie a queste proprietà, in qualità di sviluppatore di applicazioni, puoi concentrarti sulla correttezza di ogni transazione singolarmente, senza preoccuparti di come proteggerne l'esecuzione da altre transazioni che potrebbero essere eseguite contemporaneamente.
Interfaccia
Le librerie client di Spanner forniscono un'interfaccia per l'esecuzione di un corpo di lavoro nel contesto di una transazione di lettura/scrittura, con nuovi tentativi di transazione viene interrotto. Ecco un po' di contesto per spiegare questo punto: uno Spanner potrebbe essere necessario provare più volte prima di eseguire il commit. Ad esempio: se due transazioni tentano di lavorare sui dati contemporaneamente in un modo che potrebbe che causa un deadlock, Spanner ne interrompe uno in modo che l'altra transazione possono fare progressi. Più raramente, gli eventi transitori all'interno di Spanner possono provocare l'interruzione di alcune transazioni. Poiché le transazioni sono atomiche, non ha alcun effetto visibile sul database. Pertanto, le transazioni devono essere eseguite tentando di nuovo finché non vanno a buon fine.
Quando utilizzi una transazione in una libreria client Spanner, definisci il corpo di una transazione (ovvero le letture e le scritture da eseguire su una o più tabelle di un database) sotto forma di oggetto funzione. Dietro le quinte, la libreria client di Spanner esegue la funzione ripetutamente fino al commit della transazione o all'incontro di un errore non ripetibile.
Esempio
Supponiamo che tu abbia aggiunto una colonna MarketingBudget
alla tabella
Albums
mostrata nella pagina Schema e modello di dati:
CREATE TABLE Albums ( SingerId INT64 NOT NULL, AlbumId INT64 NOT NULL, AlbumTitle STRING(MAX), MarketingBudget INT64 ) PRIMARY KEY (SingerId, AlbumId);
Il reparto marketing decide di fare una spinta di marketing per l'album associato a Albums (1, 1)
e ti chiede di trasferire 200.000 $ dal budget di Albums
(2, 2)
, ma solo se i fondi sono disponibili nel budget dell'album. Dovresti
utilizza una transazione di lettura/scrittura di blocco per questa operazione, poiché la transazione
che potrebbero eseguire scritture a seconda del risultato di una lettura.
Di seguito viene mostrato come eseguire una transazione di lettura/scrittura:
C++
C#
Vai
Java
Node.js
PHP
Python
Ruby
Semantica
Serializzabilità e coerenza esterna
Spanner offre la "serializzabilità", il che significa che tutte le transazioni sembrano essere state eseguite in un ordine seriale, anche se alcune letture, scritture e altre operazioni di transazioni distinte sono effettivamente avvenute in parallelo. Spanner assegna timestamp dei commit che riflettono l'ordine delle transazioni committate per implementare questa proprietà. Di fatto, Spanner offre una maggiore garanzia rispetto alla serializzabilità, chiamata coerenza esterna: le transazioni si impegnano in un ordine che si riflette nei relativi timestamp di commit e questi I timestamp riflettono il tempo reale, quindi puoi confrontarli con il tuo smartwatch. Legge in transazione vedrà tutti gli elementi di cui è stato eseguito il commit prima della transazione i commit e le scritture sono visibili da tutto ciò che inizia dopo che la transazione impegnato.
Ad esempio, prendi in considerazione l'esecuzione di due transazioni come illustrato nel diagramma di seguito:
La transazione Txn1
in blu legge alcuni dati A
, memorizza nel buffer una scrittura in A
, quindi
di eseguire il commit. La transazione Txn2
in verde inizia dopo Txn1
, legge alcuni dati B
, quindi legge i dati A
. Poiché Txn2
legge il valore di A
dopo che Txn1
ha eseguito il commit della scrittura in A
, Txn2
vede l'effetto della scrittura di Txn1
in A
, anche se Txn2
è stato avviato prima del completamento di Txn1
.
Anche se esiste una certa sovrapposizione temporale in cui Txn1
e Txn2
vengono eseguiti, i relativi timestamp di commit c1
e c2
rispettano un ordine di transazioni lineare, il che significa che tutti gli effetti delle letture e delle scritture di Txn1
sembrano essere avvenuti in un unico punto nel tempo (c1
) e tutti gli effetti delle letture e delle scritture di Txn2
sembrano essere avvenuti in un unico punto nel tempo (c2
). Inoltre, c1 < c2
(che è garantito perché sia Txn1
che Txn2
hanno eseguito commit delle scritture; questo è vero anche se le scritture sono avvenute su macchine diverse), che rispetta l'ordine di Txn1
che avviene prima di Txn2
.
Tuttavia, se Txn2
ha eseguito solo letture nella transazione, c1 <= c2
.
Le letture osservano un prefisso della cronologia dei commit. Se una lettura vede l'effetto di Txn2
, vede anche l'effetto di Txn1
. Tutte le transazioni che vengono committate
con successo hanno questa proprietà.
Garanzie di lettura e scrittura
Se una chiamata per eseguire una transazione non va a buon fine, le garanzie di lettura e scrittura di cui disponi dipendono dall'errore con cui non è riuscita la chiamata di commit sottostante.
Ad esempio, un errore come "Riga non trovata" o "Riga già esistente" significa che durante la scrittura delle mutazioni presenti nel buffer si è verificato un errore, ad esempio una riga Il client che sta tentando di aggiornare non esiste. In questo caso, le letture sono garantite come coerenti, le scritture non vengono applicate e la non esistenza della riga è garantita come coerente anche con le letture.
Annullamento delle operazioni di transazione
Le operazioni di lettura asincrona possono essere annullate in qualsiasi momento dall'utente (ad es. quando viene annullata un'operazione di livello superiore o decidi di interrompere una lettura in base ai risultati iniziali ricevuti dalla lettura) senza influire su altre operazioni esistenti all'interno della transazione.
Tuttavia, anche se hai tentato di annullare la lettura, Spanner non garantisce che la lettura sia effettivamente annullata. Dopo aver richiesto l'annullamento di una lettura, la lettura può comunque essere completata o non riuscire per un altro motivo (ad es. Abort). Inoltre, questo ha annullato letta potrebbe restituirti alcuni risultati, ma quelli potenzialmente incompleti i risultati verranno convalidati come parte del Commit della transazione.
Tieni presente che, a differenza delle letture, l'annullamento di un'operazione di commit della transazione comporta l'interruzione della transazione (a meno che non sia già stato eseguito il commit della transazione o se non sia riuscita per un altro motivo).
Prestazioni
Chiusura in corso
Spanner consente a più client di interagire contemporaneamente con lo stesso per configurare un database. Per garantire la coerenza di più transazioni contemporaneamente, Spanner utilizza una combinazione di blocchi condivisi e blocchi esclusivi per controllare l'accesso ai dati. Quando esegui una lettura come parte di un durante la transazione, Spanner acquisisce blocchi di lettura condivisi, che consentono ad legge i dati per accedere ai dati finché la transazione non è pronta per il commit. Quando viene eseguito il commit della transazione e vengono applicate le scritture, la transazione tenta di eseguire l'upgrade a un blocco esclusivo. Blocca i nuovi blocchi di lettura condivisi sui dati, attende che quelli esistenti vengano cancellati, quindi inserisce un blocco esclusivo per l'accesso esclusivo ai dati.
Note sulle serrature:
- I blocchi vengono applicati al livello di granularità di righe e colonne. Se la transazione T1 ha colonna "A" bloccata della riga "foo" e la transazione T2 vuole scrivere la colonna "B" della riga "foo" non ci sono conflitti.
- Scrive in un dato che non legge anche i dati scritti (noti anche come "ciechi scritture") non sono in conflitto con altri utenti ciechi dello stesso elemento (il commit il timestamp di ogni scrittura determina l'ordine in cui viene applicata database). Di conseguenza, Spanner deve eseguire solo l'upgrade a un blocco esclusivo se hai letto i dati che scrivi. In caso contrario, Spanner utilizza un blocco condiviso chiamato blocco condiviso per gli autori.
- Quando esegui ricerche di righe all'interno di una transazione di lettura/scrittura, utilizza indici secondari per limitare le righe sottoposti a scansione su un intervallo più piccolo. Questo fa sì che Spanner blocchi un numero inferiore di righe nella tabella, consentendo la modifica simultanea di righe al di fuori di intervallo.
Non utilizzare blocchi per garantire l'accesso esclusivo a una risorsa all'esterno di Spanner. Le transazioni possono essere interrotte per diversi motivi: Spanner come, ad esempio, per consentire lo spostamento dei dati all'interno di e le risorse di calcolo dell'istanza. Se viene effettuato un nuovo tentativo di transazione, in modo esplicito dal codice dell'applicazione o implicitamente dal codice client, ad esempio Driver JDBC di Spanner, è che le serrature siano state trattenute durante il tentativo effettivamente commesso.
Puoi utilizzare lo strumento di introspezione Statistiche sui blocchi per esaminare i conflitti di blocco nel database.
Rilevamento di deadlock
Spanner rileva quando più transazioni potrebbero essere in stato di deadlock e forza l'interruzione di tutte le transazioni tranne una. Ad esempio, considera
lo scenario seguente: la transazione Txn1
contiene un blocco nella registrazione A
ed è in attesa
per un blocco nella registrazione B
e Txn2
tiene un blocco nel registro B
ed è in attesa
per un blocco nel registro A
. L'unico modo per avanzare in questa situazione è interrompere una delle transazioni in modo da rilasciare il blocco e consentire l'avanzamento dell'altra transazione.
Spanner utilizza l'algoritmo standard "wound-wait" per gestire il rilevamento dei deadlock. Spanner tiene traccia dell'età di ogni che richiede blocchi in conflitto. Consente inoltre alle transazioni meno recenti di abortire quelle più recenti (dove "meno recenti" indica che la lettura, la query o il commit più antichi della transazione sono avvenuti prima).
Dando la priorità alle transazioni precedenti, Spanner garantisce che ogni la transazione ha la possibilità di acquisire blocchi alla fine, una volta che diventa obsoleta abbastanza da avere una priorità più alta rispetto ad altre transazioni. Ad esempio, una transazione che acquisisce un blocco condiviso per i lettori può essere interrotta da una transazione precedente che richiede un blocco condiviso per gli autori.
Esecuzione distribuita
Spanner può eseguire transazioni su dati che si estendono su più server. Questo la potenza ha un costo in termini di prestazioni rispetto alle transazioni su singolo server.
Quali tipi di transazioni potrebbero essere distribuite? Dietro le quinte, Spanner può suddividere la responsabilità per le righe del database su più server. Riga A e le righe corrispondenti nelle tabelle con interleaving sono solitamente pubblicate dallo stesso un server web, così come due righe nella stessa tabella con chiavi vicine. Spanner può Eseguire transazioni tra righe su server diversi; tuttavia, come regola Diminuzione: le transazioni che interessano molte righe con posizioni condivise sono più veloci e economiche transazioni che interessano molte righe sparse nel database oppure in una tabella di grandi dimensioni.
Le transazioni più efficienti in Spanner includono solo le letture e scritture che devono essere applicate a livello atomico. Le transazioni sono più veloci legge e scrive i dati di accesso nella stessa parte dello spazio delle chiavi.
Transazioni di sola lettura
Oltre a bloccare le transazioni di lettura/scrittura, Spanner offre transazioni di sola lettura.
Utilizza una transazione di sola lettura quando devi eseguire più letture allo stesso timestamp. Se puoi esprimere la lettura utilizzando una delle metodi di lettura singola, è consigliabile utilizzare un solo metodo di lettura. Le prestazioni dell'uso di una singola chiamata di lettura dovrebbe essere paragonabile alle prestazioni di una singola lettura transazione.
Se stai leggendo una grande quantità di dati, valuta la possibilità di utilizzare le partizioni per leggere i dati in parallelo.
Poiché le transazioni di sola lettura non scrivono, non bloccare altre transazioni. Transazioni di sola lettura osserva un prefisso coerente della cronologia dei commit delle transazioni, l'applicazione riceve sempre dati coerenti.
Proprietà
Una transazione Spanner di sola lettura esegue un insieme di letture in un singolo punto logico, sia dal punto di vista della transazione di sola lettura stessa e dal punto di vista di altri lettori e scrittori il database Spanner. Ciò significa che le transazioni di sola lettura osservare sempre uno stato coerente del database in un punto selezionato della cronologia delle transazioni.
Interfaccia
Spanner fornisce un'interfaccia per l'esecuzione di un insieme di lavori contesto di una transazione di sola lettura, con nuovi tentativi in caso di interruzione della transazione.
Esempio
Di seguito viene mostrato come utilizzare una transazione di sola lettura per ottenere dati coerenti per due letture nello stesso timestamp:
C++
C#
Vai
Java
Node.js
PHP
Python
Ruby
Transazioni DML partizionate
Utilizzando il linguaggio di manipolazione dei dati partizionato (DML partizionato), puoi eseguire istruzioni UPDATE
e DELETE
su larga scala senza incorrere in limiti di transazioni o bloccare un'intera tabella.
Spanner partiziona lo spazio delle chiavi ed esegue gli enunciati DML su ogni
partizione in una transazione di lettura-scrittura separata.
Esegui istruzioni DML in transazioni di lettura/scrittura che crei esplicitamente nel codice. Per ulteriori informazioni, vedi Utilizzo di DML.
Proprietà
Puoi eseguire una sola istruzione DML partizionata alla volta, indipendentemente dal fatto che utilizzando un metodo della libreria client o Google Cloud CLI.
Le transazioni partizionate non supportano il commit o il rollback. Chiave inglese esegue e applica immediatamente l'istruzione DML. Se annulli l'operazione, o l'operazione non va a buon fine, Spanner annulla tutte le esecuzioni e non avvia nessuna delle partizioni rimanenti. Chiave inglese non esegue il rollback di nessuna partizione già eseguita.
Interfaccia
Spanner fornisce un'interfaccia per l'esecuzione di un singolo DML partizionato l'Informativa.
Esempi
Il seguente esempio di codice aggiorna la colonna MarketingBudget
della tabella Albums
.
C++
Puoi usare la funzione ExecutePartitionedDml()
per eseguire un'istruzione DML partizionata.
C#
Utilizzerai il metodo ExecutePartitionedUpdateAsync()
per eseguire un'istruzione DML partizionata.
Vai
Utilizza il metodo PartitionedUpdate()
per eseguire un'istruzione DML partizionata.
Java
Utilizzerai il metodo executePartitionedUpdate()
per eseguire un'istruzione DML partizionata.
Node.js
Utilizza il metodo runPartitionedUpdate()
per eseguire un'istruzione DML partizionata.
PHP
Utilizza il metodo executePartitionedUpdate()
per eseguire un'istruzione DML partizionata.
Python
Utilizza il metodo execute_partitioned_dml()
per eseguire un'istruzione DML partizionata.
Ruby
Utilizzerai il metodo execute_partitioned_update()
per eseguire un'istruzione DML partizionata.
L'esempio di codice seguente elimina le righe dalla tabella Singers
in base alla colonna SingerId
.