Questa pagina è stata tradotta dall'API Cloud Translation.

Best practice per Data Manipulation Language

Questa pagina descrive le best practice per l'utilizzo del linguaggio di manipolazione dei dati (DML) e del linguaggio DML partizionato per i database in dialetto GoogleSQL e PostgreSQL.

Utilizza una clausola `WHERE` per ridurre l'ambito delle serrature

Esegui istruzioni DML all'interno di transazioni di lettura/scrittura. Quando Spanner legge i dati, acquisisce i blocchi di lettura condivisi su porzioni limitate degli intervalli di righe letti. Nello specifico, acquisisce questi blocchi solo sulle colonne a cui accedi. Le chiusure possono includere dati che nonsoddisfano la condizione di filtro della clausola WHERE.

Quando Spanner modifica i dati utilizzando le istruzioni DML, acquisisce i blocchi esclusivi sui dati specifici che stai modificando. Inoltre, acquisisce i blocchi condivisi nello stesso modo in cui accade quando leggi i dati. Se la richiesta include intervalli di righe di grandi dimensioni o un'intera tabella, i blocchi condivisi potrebbero impedire ad altre transazioni di progredire in parallelo.

Per modificare i dati nel modo più efficiente possibile, utilizza una clausola WHERE che consenta a Spanner di leggere solo le righe necessarie. Puoi raggiungere questo obiettivo con un filtro sulla chiave primaria o sulla chiave di un indice secondario. La clausola WHERE limita l'ambito dei blocchi condivisi e consente a Spanner di elaborare l'aggiornamento in modo più efficiente.

Ad esempio, supponiamo che uno dei musicisti nella tabella Singers cambi il suo nome e tu debba aggiornare il nome nel database. Potresti eseguire la seguente istruzione DML, ma questa forza Spanner a eseguire la scansione dell'intera tabella e acquisisce i blocchi condivisi che coprono l'intera tabella. Di conseguenza, Spanner deve leggere più dati del necessario e le transazioni concorrenti non possono modificare i dati in parallelo:

-- ANTI-PATTERN: SENDING AN UPDATE WITHOUT THE PRIMARY KEY COLUMN
-- IN THE WHERE CLAUSE

UPDATE Singers SET FirstName = "Marcel"
WHERE FirstName = "Marc" AND LastName = "Richards";

Per rendere l'aggiornamento più efficiente, includi la colonna SingerId nella clausola WHERE. La colonna SingerId è l'unica colonna della chiave primaria per la tabella Singers:

-- ANTI-PATTERN: SENDING AN UPDATE THAT MUST SCAN THE ENTIRE TABLE

UPDATE Singers SET FirstName = "Marcel"
WHERE FirstName = "Marc" AND LastName = "Richards"

Se non è presente un indice su FirstName o LastName, devi eseguire la scansione dell'intera tabella per trovare i cantanti target. Se non vuoi aggiungere un indice secondario per rendere più efficiente l'aggiornamento, includi la colonna SingerId nella clausola WHERE.

La colonna SingerId è l'unica colonna di chiave primaria per la tabella Singers. Per trovarlo, esegui SELECT in una transazione di sola lettura distinta prima della transazione di aggiornamento:


  SELECT SingerId
  FROM Singers
  WHERE FirstName = "Marc" AND LastName = "Richards"

  -- Recommended: Including a seekable filter in the where clause

  UPDATE Singers SET FirstName = "Marcel"
  WHERE SingerId = 1;

Evita di utilizzare istruzioni DML e mutazioni nella stessa transazione

Spanner memorizza nella cache le inserzioni, gli aggiornamenti e le eliminazioni eseguite utilizzando istruzioni DML lato server e i risultati sono visibili alle istruzioni SQL e DML successive all'interno della stessa transazione. Questo comportamento è diverso dall'API Mutation, in cui Spanner memorizza le mutazioni lato client e le invia lato server nell'ambito dell'operazione di commit. Di conseguenza, le mutazioni nella richiesta di commit non sono visibili alle istruzioni SQL o DML all'interno della stessa transazione.

Evita di utilizzare sia istruzioni DML che mutazioni nella stessa transazione. Se li utilizzi entrambi nella stessa transazione, devi tenere conto dell'ordine di esecuzione nel codice della libreria client. Se una transazione contiene sia istruzioni DML sia mutazioni nella stessa richiesta, Spanner esegue le istruzioni DML prima delle mutazioni.

Per le operazioni supportate solo tramite le mutazioni, ti consigliamo di combinare le istruzioni DML e le mutazioni nella stessa transazione, ad esempio insert_or_update.

Se utilizzi entrambi, il buffer scrive solo alla fine della transazione.

Utilizza la funzione `PENDING_COMMIT_TIMESTAMP` per scrivere i timestamp dei commit

GoogleSQL

Utilizza la funzione PENDING_COMMIT_TIMESTAMP per scrivere il timestamp del commit in un'istruzione DML. Spanner seleziona il timestamp del commit al momento del commit della transazione.

Nota: dopo aver chiamato la funzione PENDING_COMMIT_TIMESTAMP, la tabella e qualsiasi indice derivato non sono leggibili per eventuali istruzioni SQL future nella transazione. Per questo motivo, lo stream di modifiche non può estrarre il valore precedente per la colonna con un timestamp di commit in attesa, se la colonna viene modificata di nuovo più tardi nella stessa transazione. Devi scrivere i timestamp di commit come ultima istruzione di una transazione per evitare la possibilità di provare a leggere la tabella. Se provi a leggere la tabella, Spanner genera un errore.

PostgreSQL

Utilizza la funzione SPANNER.PENDING_COMMIT_TIMESTAMP() per scrivere il timestamp del commit in un'istruzione DML. Spanner seleziona il timestamp del commit al momento del commit della transazione.

Nota: dopo aver chiamato la funzione SPANNER.PENDING_COMMIT_TIMESTAMP(), la tabella e qualsiasi indice derivato non sono leggibili per le istruzioni SQL successive nella transazione. Devi scrivere i timestamp di commit come ultima istruzione di una transazione per evitare la possibilità di provare a leggere la tabella. Se provi a leggere la tabella, Spanner restituisce un errore.

DML partizionato e funzioni di date e timestamp

La DML partizionata utilizza una o più transazioni che potrebbero essere eseguite e confermate in momenti diversi. Se utilizzi le funzioni data o timestamp, le righe modificate potrebbero contiene valori diversi.

Migliorare la latenza con la DML batch

Per ridurre la latenza, utilizza la DML batch per inviare più istruzioni DML a Spanner in un unico percorso di andata e ritorno client-server.

La DML batch può applicare ottimizzazioni a gruppi di istruzioni all'interno di un batch per consentire aggiornamenti dei dati più rapidi ed efficienti.

Eseguire le scritture con una singola richiesta

Spanner ottimizza automaticamente gruppi contigui di istruzioni simili con INSERT, UPDATE o DELETE raggruppate che hanno valori di parametro diversi, se non violano le dipendenze dei dati.

Ad esempio, considera uno scenario in cui vuoi inserire un ampio insieme di nuove righe in una tabella denominata Albums. Per consentire a Spanner di ottimizzare tutte le istruzioni INSERT richieste in un'unica azione lato server efficiente, inizia scrivendo un'istruzione DML appropriata che utilizzi i parametri di query SQL:
```
INSERT INTO Albums (SingerId, AlbumId, AlbumTitle) VALUES (@Singer, @Album, @Title);
```
Quindi, invia a Spanner un batch DML che invoca questa istruzione più volte e in modo contiguo, con le ripetizioni che differiscono solo per i valori associati ai tre parametri di query dell'istruzione. Prima di eseguirli, Spanner ottimizza queste istruzioni DML strutturalmente identiche in un'unica operazione lato server.
Eseguire le scritture in parallelo

Spanner ottimizza automaticamente i gruppi contigui di istruzioni DML eseguendoli in parallelo, se ciò non viola le dipendenze dei dati. Questa ottimizzazione offre vantaggi in termini di prestazioni a un insieme più ampio di istruzioni DML batch perché può essere applicata a una combinazione di tipi di istruzioni DML (INSERT, UPDATE e DELETE) e sia a istruzioni DML parametrizzate che non parametrizzate.

Ad esempio, il nostro schema di esempio contiene le tabelle Singers, Albums e Accounts. Albums è interlacciato in Singers e memorizza informazioni sugli album per Singers. Il seguente gruppo contiguo di istruzioni scrive nuove righe in più tabelle e non ha dipendenze di dati complesse.
```
INSERT INTO Singers (SingerId, Name) VALUES(1, "John Doe");
INSERT INTO Singers (SingerId, Name) VALUES(2, "Marcel Richards");
INSERT INTO Albums(SingerId, AlbumId, AlbumTitle) VALUES (1, 10001, "Album 1");
INSERT INTO Albums(SingerId, AlbumId, AlbumTitle) VALUES (1, 10002, "Album 2");
INSERT INTO Albums(SingerId, AlbumId, AlbumTitle) VALUES (2, 10001, "Album 1");
UPDATE Accounts SET Balance = 100 WHERE AccountId = @AccountId;
```
Spanner ottimizza questo gruppo di istruzioni DML eseguendole in parallelo. Le scritture vengono applicate nell'ordine delle istruzioni nel batch e mantengono la semantica DML batch se un'istruzione non va a buon fine durante l'esecuzione.

Best practice per Data Manipulation Language Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Utilizza una clausola WHERE per ridurre l'ambito delle serrature

Evita di utilizzare istruzioni DML e mutazioni nella stessa transazione

Utilizza la funzione PENDING_COMMIT_TIMESTAMP per scrivere i timestamp dei commit

GoogleSQL

PostgreSQL

DML partizionato e funzioni di date e timestamp

Migliorare la latenza con la DML batch

Best practice per Data Manipulation Language

Utilizza una clausola `WHERE` per ridurre l'ambito delle serrature

Utilizza la funzione `PENDING_COMMIT_TIMESTAMP` per scrivere i timestamp dei commit