Questo argomento descrive come scrivere un timestamp di commit per ogni operazione di inserimento e aggiornamento
che esegui con Spanner. Per utilizzare questa funzionalità, imposta l'opzione
allow_commit_timestamp
in una colonna TIMESTAMP
, quindi scrivi
il timestamp come parte di ogni transazione.
Panoramica
Il timestamp di commit, basato sulla tecnologia TrueTime, è l'ora in cui una transazione viene eseguita nel database. L'opzione della colonna allow_commit_timestamp
consente di archiviare in modo atomico il timestamp del commit in una colonna.
Utilizzando i timestamp di commit archiviati nelle tabelle, puoi determinare l'ordine esatto
delle mutazioni e creare funzionalità come i log delle modifiche.
Per inserire i timestamp dei commit nel database, completa i seguenti passaggi:
Crea una colonna di tipo
TIMESTAMP
con l'opzioneallow_commit_timestamp
impostata sutrue
nella definizione dello schema. Ad esempio:CREATE TABLE Performances ( ... LastUpdateTime TIMESTAMP NOT NULL OPTIONS (allow_commit_timestamp=true) ... ) PRIMARY KEY (...);
Se esegui inserimenti o aggiornamenti con DML, utilizza la funzione
PENDING_COMMIT_TIMESTAMP
per scrivere il timestamp del commit.Se esegui inserimenti o aggiornamenti con mutazioni, utilizza la stringa segnaposto
spanner.commit_timestamp()
negli inserimenti o negli aggiornamenti della colonna del timestamp del commit. Puoi anche utilizzare la costante del timestamp del commit fornita dalla libreria client. Ad esempio, questa costante nel client Java èValue.COMMIT_TIMESTAMP
.
Quando Spanner esegue il commit della transazione utilizzando questi segnaposto come valori delle colonne, il timestamp di commit effettivo viene scritto nella colonna specificata (ad esempio, la colonna LastUpdateTime
). Puoi quindi utilizzare questo valore di colonna
per creare una cronologia degli aggiornamenti della tabella.
Non è garantito che i valori del timestamp del commit siano univoci. Le transazioni che scrivono in insiemi di campi non sovrapposti potrebbero avere lo stesso timestamp. Le transazioni che scrivono in insiemi di campi sovrapposti hanno timestamp univoci.
I timestamp di commit di Spanner hanno una granularità di microsecondi
e vengono convertiti in nanosecondi quando vengono memorizzati nelle colonne TIMESTAMP
.
Creare ed eliminare una colonna del timestamp del commit
Utilizza l'opzione della colonna allow_commit_timestamp
per aggiungere e rimuovere il supporto per
i timestamp dei commit:
- Quando crei una nuova tabella per specificare che una colonna supporta i timestamp di commit.
- Quando modifica una tabella esistente:
- per aggiungere una nuova colonna che supporti i timestamp dei commit,
- per modificare una colonna
TIMESTAMP
esistente in modo che supporti i timestamp dei commit, - per modificare una colonna
TIMESTAMP
esistente in modo da rimuovere il supporto del timestamp del commit
Chiavi e indici
Puoi utilizzare una colonna timestamp di commit come colonna della chiave primaria o come colonna non chiave. Le chiavi primarie possono essere definite come ASC
o DESC
.
ASC
(impostazione predefinita) - Le chiavi crescenti sono ideali per rispondere alle query a partire da un momento specifico.DESC
: i tasti in ordine decrescente mantengono le righe più recenti nella parte superiore della tabella. Forniscono un accesso rapido ai record più recenti.
L'opzione allow_commit_timestamp
deve essere coerente tra le chiavi
primarie delle tabelle padre e figlio. Se l'opzione non è coerente tra le chiavi primarie, Spanner restituisce un errore. L'opzione può essere incoerente solo quando crei o aggiorni lo schema.
L'utilizzo dei timestamp di commit nei seguenti scenari crea hotspot che riducono le prestazioni dei dati:
Colonna del timestamp di commit come prima parte della chiave primaria di una tabella:
CREATE TABLE Users ( LastAccess TIMESTAMP NOT NULL, UserId INT64 NOT NULL, ... ) PRIMARY KEY (LastAccess, UserId);
La prima parte della chiave primaria di un indice secondario:
CREATE INDEX UsersByLastAccess ON Users(LastAccess)
o
CREATE INDEX UsersByLastAccessAndName ON Users(LastAccess, FirstName)
Gli hotspot riducono le prestazioni dei dati, anche con velocità di scrittura basse. Non ci sono costi di rendimento se i timestamp di commit sono attivati su colonne non chiave che non sono indicizzate.
Creare una colonna del timestamp di commit
Il seguente DDL crea una tabella con una colonna che supporta i timestamp di commit.
CREATE TABLE Performances (
SingerId INT64 NOT NULL,
VenueId INT64 NOT NULL,
EventDate Date,
Revenue INT64,
LastUpdateTime TIMESTAMP NOT NULL OPTIONS (allow_commit_timestamp=true)
) PRIMARY KEY (SingerId, VenueId, EventDate),
INTERLEAVE IN PARENT Singers ON DELETE CASCADE
L'aggiunta dell'opzione modifica la colonna del timestamp nel seguente modo:
- Puoi utilizzare la stringa segnaposto
spanner.commit_timestamp()
(o una costante fornita dalla libreria client) per inserimenti e aggiornamenti. - La colonna può contenere solo valori nel passato. Per ulteriori informazioni, consulta la sezione Fornire il proprio valore per il timestamp.
L'opzione allow_commit_timestamp
è sensibile alle maiuscole.
Aggiungere una colonna con il timestamp del commit a una tabella esistente
Per aggiungere una colonna con il timestamp del commit a una tabella esistente, utilizza l'istruzione ALTER TABLE
. Ad esempio, per aggiungere una colonna LastUpdateTime
alla tabella Performances
, utilizza la seguente istruzione:
ALTER TABLE Performances ADD COLUMN LastUpdateTime TIMESTAMP
NOT NULL OPTIONS (allow_commit_timestamp=true)
Convertire una colonna timestamp in una colonna timestamp di commit
Puoi convertire una colonna timestamp esistente in una colonna timestamp di commit, ma per farlo Spanner deve verificare che i valori timestamp esistenti siano nel passato. Ad esempio:
ALTER TABLE Performances ALTER COLUMN LastUpdateTime
SET OPTIONS (allow_commit_timestamp=true)
Non puoi modificare il tipo di dati o l'annotazione NULL
di una colonna in un'istruzione
ALTER TABLE
che include SET OPTIONS
. Per maggiori dettagli, vedi
Data Definition Language.
Rimuovere l'opzione del timestamp del commit
Se vuoi rimuovere il supporto dei timestamp di commit da una colonna, utilizza l'opzione
allow_commit_timestamp=null
in un'istruzione
ALTER TABLE
. Il comportamento del timestamp di commit viene rimosso, ma la colonna rimane
un timestamp. La modifica dell'opzione non altera altre caratteristiche della colonna, come il tipo o la possibilità di valori nulli (NOT NULL
). Ad esempio:
ALTER TABLE Performances ALTER COLUMN LastUpdateTime
SET OPTIONS (allow_commit_timestamp=null)
Scrivere un timestamp di commit utilizzando un'istruzione DML
Utilizzi la funzione PENDING_COMMIT_TIMESTAMP
per scrivere il timestamp del commit in un'istruzione DML. Spanner seleziona il timestamp di commit quando viene eseguito il commit della transazione.
La seguente istruzione DML aggiorna la colonna LastUpdateTime
nella
tabella Performances
con il timestamp di commit:
UPDATE Performances SET LastUpdateTime = PENDING_COMMIT_TIMESTAMP()
WHERE SingerId=1 AND VenueId=2 AND EventDate="2015-10-21"
Il seguente esempio di codice utilizza la funzione
PENDING_COMMIT_TIMESTAMP
per scrivere il timestamp del commit nella colonna LastUpdateTime
.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Ruby
I timestamp di commit possono essere scritti solo nelle colonne annotate con l'opzione
allow_commit_timestamp=true
.
Se hai mutazioni su righe in più tabelle, devi specificare
spanner.commit_timestamp()
(o la costante
della libreria client) per la colonna del timestamp di commit in ogni tabella.
Eseguire query su una colonna del timestamp di commit
L'esempio seguente esegue una query sulla colonna del timestamp del commit della tabella.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Fornisci il tuo valore per la colonna del timestamp del commit
Puoi fornire un valore personalizzato per la colonna del timestamp del commit, anziché
trasmettere spanner.commit_timestamp()
(o la costante della libreria client) come
valore della colonna. Il valore deve essere un timestamp nel passato. Questa limitazione
garantisce che la scrittura dei timestamp sia un'operazione economica e veloce. Il server
restituisce un errore FailedPrecondition
se viene specificato un timestamp futuro.
Creare un log delle modifiche
Supponiamo di voler creare un log delle modifiche di ogni mutazione che si verifica in una tabella e poi utilizzare questo log per l'audit. Un esempio è una tabella che memorizza la cronologia delle modifiche apportate ai documenti di elaborazione di testi. Il timestamp del commit semplifica la creazione del log delle modifiche, perché i timestamp possono imporre l'ordinamento delle voci del log delle modifiche. Puoi creare un changelog che memorizzi la cronologia delle modifiche apportate a un determinato documento utilizzando uno schema come il seguente esempio:
CREATE TABLE Documents (
UserId INT64 NOT NULL,
DocumentId INT64 NOT NULL,
Contents STRING(MAX) NOT NULL,
) PRIMARY KEY (UserId, DocumentId);
CREATE TABLE DocumentHistory (
UserId INT64 NOT NULL,
DocumentId INT64 NOT NULL,
Ts TIMESTAMP NOT NULL OPTIONS (allow_commit_timestamp=true),
Delta STRING(MAX),
) PRIMARY KEY (UserId, DocumentId, Ts),
INTERLEAVE IN PARENT Documents ON DELETE NO ACTION;
Per creare un log delle modifiche, inserisci una nuova riga in DocumentHistory
nella stessa
transazione in cui inserisci o aggiorni una riga in Document
. Nell'inserimento
della nuova riga in DocumentHistory
, utilizza il segnaposto
spanner.commit_timestamp()
(o la costante della libreria client) per indicare
a Spanner di scrivere il timestamp del commit nella colonna Ts
. L'interleaving
della tabella DocumentsHistory
con la tabella Documents
consentirà la località dei dati
e inserimenti e aggiornamenti più efficienti. Tuttavia, aggiunge anche il
vincolo che le righe padre e figlio
devono essere eliminate insieme. Per conservare le righe in DocumentHistory
dopo l'eliminazione delle righe in Documents
, non alternare le tabelle.
Ottimizzare le query sui dati recenti con i timestamp di commit
I timestamp di commit consentono un'ottimizzazione di Spanner che può ridurre l'I/O delle query durante il recupero dei dati scritti dopo un determinato periodo di tempo.
Per attivare questa ottimizzazione, la clausola WHERE
di una query deve includere un
confronto tra la colonna del timestamp di commit di una tabella e un orario specifico
che fornisci, con i seguenti attributi:
Fornisci l'ora specifica come espressione costante: un valore letterale, un parametro o una funzione i cui argomenti vengono valutati come costanti.
Confronta se il timestamp di commit è più recente dell'ora specificata, tramite gli operatori
>
o>=
.Se vuoi, aggiungi ulteriori limitazioni alla clausola
WHERE
conAND
. L'estensione della clausola conOR
squalifica la query da questa ottimizzazione.
Ad esempio, considera la seguente tabella Performances
, che include
una colonna con il timestamp del commit:
CREATE TABLE Performances (
SingerId INT64 NOT NULL,
VenueId INT64 NOT NULL,
EventDate DATE,
Revenue INT64,
LastUpdateTime TIMESTAMP NOT NULL OPTIONS (allow_commit_timestamp=true)
) PRIMARY KEY (SingerId, VenueId, EventDate);
Questa query beneficia dell'ottimizzazione del timestamp di commit descritta in precedenza, perché ha un confronto maggiore o uguale tra la colonna del timestamp di commit della tabella e un'espressione costante, in questo caso, un valore letterale:
SELECT * FROM Performances WHERE LastUpdateTime >= "2022-05-01";
Anche la seguente query è idonea per l'ottimizzazione, poiché presenta un confronto maggiore di tra il timestamp del commit e una funzione i cui argomenti vengono tutti valutati come costanti durante l'esecuzione della query:
SELECT * FROM Performances
WHERE LastUpdateTime > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 30 DAY);
Passaggi successivi
- Utilizza i timestamp dei commit per creare un log delle modifiche con Go.