Cette page décrit les bonnes pratiques d'utilisation du langage de manipulation de données (LMD) et du LMD partitionné pour les bases de données en dialecte GoogleSQL et en dialecte PostgreSQL.
Utiliser une clause WHERE
pour réduire le champ d'application des verrouillages
Les instructions LMD sont exécutées dans les transactions de lecture-écriture. Lorsque Spanner lit des données, il acquiert des verrous en lecture partagés sur les parties limitées des plages de lignes que vous consultez. Plus précisément, il n'acquiert ces verrous que sur les colonnes auxquelles vous accédez. Les verrous peuvent inclure des données qui ne satisfont pas la condition de filtre de la clause WHERE
.
Lorsque Spanner modifie des données à l'aide d'instructions LMD, il acquiert des verrous exclusifs sur les données spécifiques que vous modifiez. De plus, il acquiert des verrous partagés de la même manière que lorsque vous consultez des données. Si votre requête inclut de grandes plages de lignes ou une table entière, les verrous partagés peuvent empêcher les autres transactions de progresser en parallèle.
Pour modifier les données aussi efficacement que possible, utilisez une clause WHERE
permettant à Spanner de ne lire que les lignes nécessaires. Pour ce faire, appliquez un filtre sur la clé primaire ou sur la clé d'un index secondaire. La clause WHERE
limite le champ d'application des verrous partagés et permet à Spanner de traiter la modification plus efficacement.
Par exemple, imaginons que l'un des musiciens de la table Singers
change de prénom et que vous deviez mettre à jour ce prénom dans votre base de données. Vous pouvez exécuter l'instruction LMD suivante, mais elle oblige Spanner à analyser l'ensemble de la table et à acquérir des verrous partagés qui la couvrent dans sa totalité. Par conséquent, Spanner doit lire davantage de données que nécessaire, et les transactions simultanées ne peuvent pas modifier les données en parallèle:
-- ANTI-PATTERN: SENDING AN UPDATE WITHOUT THE PRIMARY KEY COLUMN
-- IN THE WHERE CLAUSE
UPDATE Singers SET FirstName = "Marcel"
WHERE FirstName = "Marc" AND LastName = "Richards";
Pour optimiser l'opération de mise à jour, incluez la colonne SingerId
dans la clause WHERE
. La colonne SingerId
est la seule colonne de clé primaire pour la table Singers
:
-- ANTI-PATTERN: SENDING AN UPDATE THAT MUST SCAN THE ENTIRE TABLE
UPDATE Singers SET FirstName = "Marcel"
WHERE FirstName = "Marc" AND LastName = "Richards"
Si aucun indice n'est défini sur FirstName
ou LastName
, vous devez analyser l'ensemble de la table pour trouver les chanteurs cibles. Si vous ne souhaitez pas ajouter d'index secondaire pour optimiser la mise à jour, incluez la colonne SingerId
dans la clause WHERE
.
La colonne SingerId
est la seule colonne de clé primaire pour la table Singers
. Pour le trouver, exécutez SELECT
dans une transaction en lecture seule distincte avant la transaction de mise à jour:
SELECT SingerId
FROM Singers
WHERE FirstName = "Marc" AND LastName = "Richards"
-- Recommended: Including a seekable filter in the where clause
UPDATE Singers SET FirstName = "Marcel"
WHERE SingerId = 1;
Éviter d'utiliser des instructions LMD et des mutations dans la même transaction
Spanner met en tampon les insertions, les mises à jour et les suppressions effectuées à l'aide d'instructions LMD côté serveur. Les résultats sont visibles pour les instructions SQL et LMD ultérieures dans la même transaction. Ce comportement est différent de celui de l'API Mutation, où Spanner met en tampon les mutations côté client et les envoie côté serveur dans le cadre de l'opération de commit. En conséquence, les mutations dans la requête de commit ne sont pas visibles pour les instructions SQL ou LMD dans la même transaction.
Évitez d'utiliser à la fois des instructions LMD et des mutations dans la même transaction. Si vous utilisez les deux dans la même transaction, vous devez tenir compte de l'ordre d'exécution dans le code de votre bibliothèque cliente. Si une transaction contient à la fois des instructions LMD et des mutations dans la même requête, Spanner exécute les instructions LMD avant les mutations.
Pour les opérations qui ne sont acceptées que par le biais de mutations, vous pouvez combiner des instructions LMD et des mutations dans la même transaction (par exemple, insert_or_update
).
Si vous utilisez les deux, le tampon n'effectue les écritures qu'à la toute fin de la transaction.
Utiliser la fonction PENDING_COMMIT_TIMESTAMP
pour écrire des horodatages de commit
Pour écrire l'horodatage de commit dans une instruction LMD, utilisez la fonction PENDING_COMMIT_TIMESTAMP
. Spanner sélectionne l'horodatage de commit lorsque la transaction est enregistrée.
Pour écrire l'horodatage de commit dans une instruction LMD, utilisez la fonction SPANNER.PENDING_COMMIT_TIMESTAMP()
. Spanner sélectionne l'horodatage de commit lorsque la transaction est enregistrée.
LMD partitionné, et fonctions de date et d'horodatage
Le LMD partitionné utilise une ou plusieurs transactions pouvant être exécutées et enregistrées à des moments différents. Si vous utilisez les fonctions date ou horodatage, les lignes modifiées peuvent contenir des valeurs différentes.
Améliorer la latence avec le LMD par lots
Pour réduire la latence, utilisez le traitement LMD par lots pour envoyer plusieurs instructions LMD à Spanner dans un seul aller-retour client-serveur.
La LMD par lot peut appliquer des optimisations à des groupes d'instructions dans un lot pour permettre des mises à jour de données plus rapides et plus efficaces.
Exécuter des écritures avec une seule requête
Spanner optimise automatiquement les groupes contigus d'instructions groupées
INSERT
,UPDATE
ouDELETE
similaires qui ont des valeurs de paramètre différentes, si elles ne s'opposent pas aux dépendances de données.Imaginons que vous souhaitiez insérer un grand nombre de nouvelles lignes dans une table appelée
Albums
. Pour permettre à Spanner d'optimiser toutes les instructionsINSERT
requises en une seule action côté serveur efficace, commencez par écrire une instruction DML appropriée qui utilise des paramètres de requête SQL:INSERT INTO Albums (SingerId, AlbumId, AlbumTitle) VALUES (@Singer, @Album, @Title);
Ensuite, envoyez à Spanner un lot de LMD qui appelle cette instruction de manière répétée et contiguë, les répétitions ne différant que par les valeurs que vous liez aux trois paramètres de requête de l'instruction. Spanner optimise ces instructions DML structurellement identiques en une seule opération côté serveur avant de les exécuter.
Exécuter des écritures en parallèle
Spanner optimise automatiquement les groupes contigus d'instructions DML en les exécutant en parallèle lorsque cela n'enfreint pas les dépendances de données. Cette optimisation offre des avantages en termes de performances à un ensemble plus large d'instructions LMD groupées, car elle peut s'appliquer à un mélange de types d'instructions LMD (
INSERT
,UPDATE
etDELETE
) et aux instructions LMD paramétrées ou non.Par exemple, notre exemple de schéma contient les tables
Singers
,Albums
etAccounts
.Albums
est entrelacé dansSingers
et stocke des informations sur les albums pourSingers
. Le groupe contigu d'instructions suivant écrit de nouvelles lignes dans plusieurs tables et ne comporte pas de dépendances de données complexes.INSERT INTO Singers (SingerId, Name) VALUES(1, "John Doe"); INSERT INTO Singers (SingerId, Name) VALUES(2, "Marcel Richards"); INSERT INTO Albums(SingerId, AlbumId, AlbumTitle) VALUES (1, 10001, "Album 1"); INSERT INTO Albums(SingerId, AlbumId, AlbumTitle) VALUES (1, 10002, "Album 2"); INSERT INTO Albums(SingerId, AlbumId, AlbumTitle) VALUES (2, 10001, "Album 1"); UPDATE Accounts SET Balance = 100 WHERE AccountId = @AccountId;
Spanner optimise ce groupe d'instructions LMD en les exécutant en parallèle. Les écritures sont appliquées dans l'ordre des instructions du lot et conservent la sémantique LMD par lot si une instruction échoue lors de l'exécution.