Dans une base de données Spanner, Spanner crée automatiquement
pour la clé primaire de chaque table. Par exemple, vous n'avez rien à faire pour indexer la clé primaire de Singers
, car elle est indexée automatiquement pour vous.
Vous pouvez également créer des index secondaires pour d'autres colonnes. L'ajout d'un index secondaire sur une colonne facilite la recherche des données dans cette colonne. Pour
Par exemple, pour rechercher rapidement un album par titre, vous devez
créer un index secondaire sur AlbumTitle
;
afin que Spanner n'ait pas besoin d'analyser l'intégralité de la table.
Si la recherche de l'exemple précédent est
effectuée dans une transaction en lecture-écriture,
alors la recherche plus efficace évite également
de maintenir des verrous sur la table entière,
qui permet des insertions et des mises à jour simultanées dans la table pour les lignes situées en dehors de
Plage de recherche AlbumTitle
.
En plus des avantages qu'ils apportent aux recherches, les index secondaires aident aussi Spanner à exécuter des analyses plus efficaces, ce qui permet des analyses d'index plutôt que des analyses complètes de tables.
Spanner stocke les données suivantes dans chaque index secondaire:
- Toutes les colonnes clés de la table de base
- Toutes les colonnes incluses dans l'index
- Toutes les colonnes spécifiées dans la clause facultative
STORING
(bases de données en dialecte GoogleSQL) ou la clauseINCLUDE
(bases de données en dialecte PostgreSQL) de la définition de l'index.
Au fil du temps, Spanner analyse vos tables pour s'assurer que vos index secondaires sont utilisés pour les requêtes appropriées.
Ajouter un index secondaire
Le moment le plus efficace pour ajouter un index secondaire est lors de la création de la table. Pour créer une table et ses index en même temps, envoyez les instructions LDD pour la nouvelle table et les nouveaux index en une seule requête adressée à Spanner.
Dans Spanner, vous pouvez également ajouter un index secondaire à un pendant que la base de données continue à diffuser le trafic. Comme toute autre modification de schéma dans Spanner, l'ajout d'un index à une base de données existante ne nécessite pas de mettre cette base de données hors connexion et n'entraîne pas le verrouillage de colonnes ou de tables entières.
Chaque fois qu'un index est ajouté à une table existante, Spanner remplit automatiquement l'index afin de refléter une vue à jour des données indexées. Spanner gère ce processus de remplissage Il s'exécute en arrière-plan à l'aide des ressources de nœuds leur priorité. Dans la plupart des cas, il n'est pas possible d'accélérer le processus (par exemple, en ajoutant d'autres nœuds), et le remplissage en arrière n'affecte pas de manière significative les performances de la base de données.
La création d'un index peut prendre de quelques minutes à plusieurs heures. La création d'index étant une mise à jour du schéma, elle est soumise aux mêmes contraintes de performances que toute autre mise à jour de schéma. Le temps nécessaire à la création d'un index secondaire dépend de plusieurs facteurs :
- Taille de l'ensemble de données
- La capacité de calcul de l'instance
- La charge sur l'instance
Pour afficher la progression d'un processus de remplissage d'index, consultez la section de progression.
Notez que l'utilisation de la colonne commit timestamp en tant que première partie de l'index secondaire peut créer des hotspots et réduire les performances en écriture.
Utilisez l'instruction CREATE INDEX
pour définir un index secondaire dans votre schéma. Voici quelques exemples :
Pour indexer tous les chanteurs (Singers
) de la base de données par leur prénom et leur nom :
GoogleSQL
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName);
PostgreSQL
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName);
Pour créer un index de tous les titres (Songs
) de la base de données selon la valeur SongName
:
GoogleSQL
CREATE INDEX SongsBySongName ON Songs(SongName);
PostgreSQL
CREATE INDEX SongsBySongName ON Songs(SongName);
Pour n'indexer que les titres d'un chanteur particulier, entrelacez l'index dans la table Singers
à l'aide de la clause INTERLEAVE IN
:
GoogleSQL
CREATE INDEX SongsBySingerSongName ON Songs(SingerId, SongName),
INTERLEAVE IN Singers;
PostgreSQL
CREATE INDEX SongsBySingerSongName ON Songs(SingerId, SongName)
INTERLEAVE IN Singers;
Pour n'indexer que les titres d'un album particulier :
GoogleSQL
CREATE INDEX SongsBySingerAlbumSongName ON Songs(SingerId, AlbumId, SongName),
INTERLEAVE IN Albums;
PostgreSQL
CREATE INDEX SongsBySingerAlbumSongName ON Songs(SingerId, AlbumId, SongName)
INTERLEAVE IN Albums;
Pour indexer par ordre décroissant de SongName
:
GoogleSQL
CREATE INDEX SongsBySingerAlbumSongNameDesc ON Songs(SingerId, AlbumId, SongName DESC),
INTERLEAVE IN Albums;
PostgreSQL
CREATE INDEX SongsBySingerAlbumSongNameDesc ON Songs(SingerId, AlbumId, SongName DESC)
INTERLEAVE IN Albums;
Notez que l'annotation DESC
précédente ne s'applique qu'à SongName
. Pour indexer par ordre décroissant d'autres clés d'index, annotez-les avec DESC
: SingerId DESC, AlbumId DESC
.
Notez également que PRIMARY_KEY
est un mot réservé ne pouvant pas être utilisé comme nom d'index. Il s'agit du nom donné à l'index pseudo-index établi lors de la création d'une table avec la spécification PRIMARY KEY.
Pour plus de détails et de bonnes pratiques concernant le choix des index non entrelacés et des index entrelacés, consultez les sections Options d'index et Utiliser un index entrelacé sur une colonne dont la valeur augmente ou diminue de façon linéaire.
Vérifier la progression du remplissage de l'index
Console
Dans le menu de navigation Spanner, cliquez sur l'onglet Opérations. La page Opérations affiche la liste des opérations en cours d'exécution.
Recherchez l'opération de remplissage dans la liste. S'il est toujours en cours d'exécution, l'indicateur de progression de la colonne Heure de fin affiche le pourcentage terminée, comme illustré dans l'image suivante:
gcloud
Utilisez gcloud spanner operations describe
pour vérifier la progression d'une opération.
Obtenez l'ID d'opération:
gcloud spanner operations list --instance=INSTANCE-NAME \ --database=DATABASE-NAME --type=DATABASE_UPDATE_DDL
Remplacez les éléments suivants :
- INSTANCE-NAME par le nom de l'instance Spanner.
- DATABASE-NAME par le nom de la base de données.
Consignes d'utilisation :
Pour limiter la liste, spécifiez l'option
--filter
. Exemple :--filter="metadata.name:example-db"
ne répertorie que les opérations sur une base de données spécifique.--filter="error:*"
ne répertorie que les opérations de sauvegarde qui ont échoué.
Pour en savoir plus sur la syntaxe des filtres, consultez la page gcloud topic filters. Pour en savoir plus sur le filtrage des opérations de sauvegarde, consultez le champ
filter
dans ListBackupOperationsRequest.L'option
--type
n'est pas sensible à la casse.
La sortie ressemble à ceci :
OPERATION_ID STATEMENTS DONE @TYPE _auto_op_123456 CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName) False UpdateDatabaseDdlMetadata CREATE INDEX SongsBySingerAlbumSongName ON Songs(SingerId, AlbumId, SongName), INTERLEAVE IN Albums _auto_op_234567 True CreateDatabaseMetadata
Exécuter
gcloud spanner operations describe
gcloud spanner operations describe \ --instance=INSTANCE-NAME \ --database=DATABASE-NAME \ projects/PROJECT-NAME/instances/INSTANCE-NAME/databases/DATABASE-NAME/operations/OPERATION_ID
Remplacez les éléments suivants :
- INSTANCE-NAME: nom de l'instance Spanner.
- DATABASE-NAME: nom de la base de données Spanner.
- PROJECT-NAME: nom du projet.
- OPERATION-ID : ID de l'opération que vous souhaitez vérifier.
La section
progress
du résultat indique le pourcentage de l'opération c'est terminé. Le résultat ressemble à ceci :done: true ... progress: - endTime: '2021-01-22T21:58:42.912540Z' progressPercent: 100 startTime: '2021-01-22T21:58:11.053996Z' - progressPercent: 67 startTime: '2021-01-22T21:58:11.053996Z' ...
REST v1
Obtenez l'ID de l'opération :
gcloud spanner operations list --instance=INSTANCE-NAME
--database=DATABASE-NAME --type=DATABASE_UPDATE_DDL
Remplacez les éléments suivants :
- INSTANCE-NAME par le nom de l'instance Spanner.
- DATABASE-NAME par le nom de la base de données.
Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
- PROJECT-ID : ID du projet.
- INSTANCE-ID : ID de l'instance.
- DATABASE-ID: ID de la base de données.
- OPERATION-ID : ID de l'opération.
Méthode HTTP et URL :
GET https://spanner.googleapis.com/v1/projects/PROJECT-ID/instances/INSTANCE-ID/databases/DATABASE-ID/operations/OPERATION-ID
Pour envoyer votre requête, développez l'une des options suivantes :
Vous devriez recevoir une réponse JSON de ce type :
{ ... "progress": [ { "progressPercent": 100, "startTime": "2023-05-27T00:52:27.366688Z", "endTime": "2023-05-27T00:52:30.184845Z" }, { "progressPercent": 100, "startTime": "2023-05-27T00:52:30.184845Z", "endTime": "2023-05-27T00:52:40.750959Z" } ], ... "done": true, "response": { "@type": "type.googleapis.com/google.protobuf.Empty" } }
Pour gcloud
et REST, vous pouvez consulter la progression de chaque remplissage d'index
dans la section progress
. Pour chaque instruction du tableau d’instructions,
il existe un champ correspondant
dans le tableau de progression. Cet ordre de tableau de progression correspond à l'ordre du tableau d'instructions. Une fois qu'elles sont disponibles,
Les champs startTime
, progressPercent
et endTime
sont renseignés en conséquence.
Notez que le résultat n'indique pas la durée estimée du remplissage
de votre application.
Si l'opération prend trop de temps, vous pouvez l'annuler. Pour en savoir plus, consultez Annuler la création de l'index
Scénarios d'affichage de la progression du remplissage d'index
Différents scénarios peuvent se produire lorsque vous essayez de vérifier la progression d'un remplissage d'index. Les instructions de création d'index qui nécessitent un remplissage d'index font partie des opérations de mise à jour de schéma. Il peut y avoir plusieurs instructions faisant partie d'une opération de mise à jour de schéma.
Le premier scénario est le plus simple : lorsque l'instruction de création d'index
est la première instruction de l'opération de mise à jour du schéma. Étant donné que l'instruction de création d'index est la première instruction, elle est la première à être traitée et exécutée en raison de l'ordre d'exécution.
Immédiatement, le champ startTime
de l'instruction de création d'index
est renseigné avec l'heure de début de l'opération de mise à jour du schéma. Ensuite, le champ progressPercent
de l'instruction de création d'index est renseigné lorsque la progression du remplissage de l'index est supérieure à 0 %. Enfin, le champ endTime
est renseigné une fois l'instruction validée.
Deuxième scénario : lorsque l'instruction de création d'index n'est pas la première
dans l'opération de mise à jour du schéma. Aucun champ lié à l'instruction de création d'index ne sera renseigné tant que l'ordre d'exécution n'aura pas été appliqué aux instructions précédentes.
Comme dans le scénario précédent, une fois que les déclarations précédentes ont été validées,
Le champ startTime
de l'instruction de création d'index est renseigné en premier, suivi de
le champ progressPercent
. Enfin, le champ endTime
est renseigné une fois l'instruction terminée.
Annuler la création de l'index
Vous pouvez utiliser la Google Cloud CLI pour annuler la création de l'index. Pour récupérer une liste
de mise à jour de schéma d'une base de données Spanner,
gcloud spanner operations list
et incluez
l'option --filter
:
gcloud spanner operations list \
--instance=INSTANCE \
--database=DATABASE \
--filter="@TYPE:UpdateDatabaseDdlMetadata"
Recherchez le OPERATION_ID
pour l'opération que vous souhaitez annuler, puis utilisez la commande gcloud spanner operations cancel
pour l'annuler :
gcloud spanner operations cancel OPERATION_ID \
--instance=INSTANCE \
--database=DATABASE
Afficher les index existants
Pour afficher des informations sur les index existants d'une base de données, vous pouvez utiliser la Console Google Cloud ou Google Cloud CLI:
Console
Accédez à la page Instances de Spanner dans la console Google Cloud.
Cliquez sur le nom de l'instance que vous souhaitez afficher.
Dans le volet de gauche, cliquez sur la base de données à afficher, puis sur la table que vous souhaitez consulter.
Cliquez sur l'onglet Index. La console Google Cloud affiche une liste index.
Facultatif : Pour obtenir des détails sur un index, par exemple les colonnes qu'il contient, cliquez sur le nom de l'index.
gcloud
Exécutez la commande gcloud spanner databases ddl describe
:
gcloud spanner databases ddl describe DATABASE \
--instance=INSTANCE
La CLI gcloud affiche les instructions DDL (Data Definition Language) pour créer les tables et les index de la base de données. Les instructions CREATE
INDEX
décrivent les index existants. Exemple :
--- |-
CREATE TABLE Singers (
SingerId INT64 NOT NULL,
FirstName STRING(1024),
LastName STRING(1024),
SingerInfo BYTES(MAX),
) PRIMARY KEY(SingerId)
---
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName)
Requête avec un index spécifique
Les sections suivantes expliquent comment spécifier un index dans une instruction SQL et avec l'interface de lecture pour Spanner. Les exemples de ces sections supposent que vous avez ajouté une colonne MarketingBudget
à la table Albums
et que vous avez créé un index appelé AlbumsByAlbumTitle
:
GoogleSQL
CREATE TABLE Albums (
SingerId INT64 NOT NULL,
AlbumId INT64 NOT NULL,
AlbumTitle STRING(MAX),
MarketingBudget INT64,
) PRIMARY KEY (SingerId, AlbumId),
INTERLEAVE IN PARENT Singers ON DELETE CASCADE;
CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle);
PostgreSQL
CREATE TABLE Albums (
SingerId BIGINT NOT NULL,
AlbumId BIGINT NOT NULL,
AlbumTitle VARCHAR,
MarketingBudget BIGINT,
PRIMARY KEY (SingerId, AlbumId)
) INTERLEAVE IN PARENT Singers ON DELETE CASCADE;
CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle);
Spécifier un index dans une instruction SQL
Lorsque vous utilisez SQL pour interroger une table Spanner, Spanner
utilise tous les index susceptibles de rendre la requête plus efficace. Par conséquent,
vous n'avez pas besoin de spécifier un index pour les requêtes SQL. Toutefois, pour les requêtes critiques pour votre charge de travail, Google vous conseille d'utiliser des directives FORCE_INDEX
dans vos instructions SQL afin d'obtenir des performances plus cohérentes.
Dans certains cas, Spanner peut choisir un index générant des requêtes la latence doit être augmentée. Si vous avez suivi la procédure de dépannage des régressions de performances et vérifié qu'il est judicieux d'essayer un autre index pour la requête, vous pouvez spécifier l'index.
Pour spécifier un index dans une instruction SQL, utilisez la méthode FORCE_INDEX
.
Conseil pour fournir une directive d'index. Les directives d'index utilisent la syntaxe suivante :
GoogleSQL
FROM MyTable@{FORCE_INDEX=MyTableIndex}
PostgreSQL
FROM MyTable /*@ FORCE_INDEX = MyTableIndex */
Vous pouvez également utiliser une directive d'index pour indiquer à Spanner d'analyser la table de base au lieu d'utiliser un index :
GoogleSQL
FROM MyTable@{FORCE_INDEX=_BASE_TABLE}
PostgreSQL
FROM MyTable /*@ FORCE_INDEX = _BASE_TABLE */
L'exemple suivant illustre une requête SQL qui spécifie un index :
GoogleSQL
SELECT AlbumId, AlbumTitle, MarketingBudget
FROM Albums@{FORCE_INDEX=AlbumsByAlbumTitle}
WHERE AlbumTitle >= "Aardvark" AND AlbumTitle < "Goo";
PostgreSQL
SELECT AlbumId, AlbumTitle, MarketingBudget
FROM Albums /*@ FORCE_INDEX = AlbumsByAlbumTitle */
WHERE AlbumTitle >= 'Aardvark' AND AlbumTitle < 'Goo';
Une directive d'index peut forcer le processeur de requêtes de Spanner à lire
des colonnes supplémentaires requises par la requête,
mais qui ne sont pas stockées dans l'index.
Le processeur de requêtes récupère ces colonnes en joignant l'index et la table de base. Pour éviter cette jointure supplémentaire, utilisez une méthode
Clause STORING
(bases de données de dialecte GoogleSQL) ou INCLUDE
(bases de données de dialecte PostgreSQL) pour
stocker les colonnes
supplémentaires dans l'index.
Dans l'exemple précédent, la colonne MarketingBudget
n'est pas stockée dans l'index, mais la requête SQL sélectionne cette colonne. Par conséquent,
Spanner doit rechercher la colonne MarketingBudget
dans la table de base,
puis associez-la aux données de l'index pour renvoyer les résultats de la requête.
Spanner génère une erreur si la directive "index" comporte l'un des éléments suivants : problèmes:
- L'index n'existe pas.
- L'index se trouve dans une autre table de base.
- Il manque une expression de filtrage
NULL
obligatoire dans la requête pour un indexNULL_FILTERED
.
Les exemples suivants montrent comment écrire et exécuter des requêtes qui récupèrent les valeurs de AlbumId
, AlbumTitle
et MarketingBudget
à l'aide de l'index AlbumsByAlbumTitle
:
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Spécifier un index dans l'interface de lecture
Lorsque vous utilisez l'interface de lecture pour Spanner et que vous souhaitez que Spanner Pour utiliser un index, vous devez le spécifier. L'interface de lecture ne sélectionne pas automatiquement l'index.
En outre, votre index doit contenir toutes les données qui apparaissent dans les résultats de la requête, à l'exception des colonnes qui font partie de la clé primaire. Cette restriction existe, car l'interface de lecture ne prend pas en charge les jointures entre l'index et la table de base. Si vous devez inclure d'autres colonnes dans les résultats de la requête, vous disposez de plusieurs options :
- Utilisez une clause
STORING
ouINCLUDE
pour stocker les colonnes supplémentaires dans l'index. - Effectuez une requête sans inclure les colonnes supplémentaires, puis utilisez les clés primaires pour envoyer une autre requête qui lit les colonnes supplémentaires.
Spanner renvoie les valeurs de l'index par ordre de tri croissant par clé d'index. Pour récupérer les valeurs dans l'ordre décroissant, procédez comme suit :
Ajoutez à la clé d'index l'annotation
DESC
: Exemple :CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle DESC);
L'annotation
DESC
s'applique à une seule clé d'index. Si l'index comprend plusieurs clés et si vous souhaitez que les résultats de la requête apparaissent dans l'ordre décroissant en fonction de toutes les clés, ajoutez une annotationDESC
pour chaque clé.Si la lecture spécifie une plage de clés, assurez-vous que la plage de clés est également dans l'ordre décroissant. En d'autres termes, la valeur de la clé de début doit être supérieure à la valeur de la clé de fin.
L'exemple suivant montre comment extraire les valeurs de AlbumId
et AlbumTitle
à l'aide de l'index AlbumsByAlbumTitle
:
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Créer un index pour les analyses en mode index uniquement
Vous pouvez éventuellement utiliser la clause STORING
(pour les bases de données de dialecte GoogleSQL) ou INCLUDE
.
(pour les bases de données de dialecte PostgreSQL) pour stocker une copie d'une colonne dans la
de l'index. Ce type d'index offre des avantages pour les requêtes et les appels en lecture utilisant l'index, au prix d'un stockage supplémentaire :
- Requêtes SQL qui utilisent l'index et sélectionnent les colonnes stockées dans le
STORING
ouINCLUDE
ne nécessitent pas de jointure supplémentaire à la table de base. - Les appels
read()
qui utilisent l'index peuvent lire les colonnes stockées par la clauseSTORING
/INCLUDE
.
Par exemple, supposons que vous ayez créé une autre version de AlbumsByAlbumTitle
.
qui stocke une copie de la colonne MarketingBudget
dans l'index (notez que
STORING
ou INCLUDE
en gras):
GoogleSQL
CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) STORING (MarketingBudget);
PostgreSQL
CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) INCLUDE (MarketingBudget);
Avec l'ancien index AlbumsByAlbumTitle
, Spanner doit rejoindre l'index
avec la table de base, puis récupérez la colonne à partir de la table de base. Avec le nouveau
AlbumsByAlbumTitle2
, Spanner lit la colonne directement à partir du
, ce qui est plus efficace.
Si vous utilisez l'interface de lecture au lieu de SQL, le nouvel index AlbumsByAlbumTitle2
vous permet également de lire directement la colonne MarketingBudget
:
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Modifier un indice
Vous pouvez utiliser l'instruction ALTER INDEX
pour ajouter des colonnes supplémentaires
dans un index existant
ou supprimer des colonnes. Cela peut modifier la liste des colonnes définie par la clause STORING
(bases de données GoogleSQL) ou la clause INCLUDE
(bases de données PostgreSQL) lorsque vous créez l'index. Vous ne pouvez pas utiliser cette instruction pour ajouter des colonnes ou supprimer des colonnes
à partir de la clé d'index. Par exemple, au lieu de créer
l'index AlbumsByAlbumTitle2
, vous pouvez utiliser ALTER INDEX
pour ajouter
dans AlbumsByAlbumTitle
, comme illustré dans l'exemple suivant:
GoogleSQL
ALTER INDEX AlbumsByAlbumTitle ADD STORED COLUMN MarketingBudget
PostgreSQL
ALTER INDEX AlbumsByAlbumTitle ADD INCLUDE COLUMN MarketingBudget
Lorsque vous ajoutez une colonne à un index existant, Spanner
utilise un processus de remplissage en arrière-plan. Tant que le remplissage est en cours, la colonne de l'index n'est pas lisible. Vous ne bénéficierez donc peut-être pas de l'amélioration des performances attendue. Vous pouvez utiliser la commande gcloud spanner operations
pour lister l'opération de longue durée et afficher son état.
Pour en savoir plus, consultez décrire l'opération.
Vous pouvez également utiliser cancel operation pour annuler une opération en cours d'exécution.
Une fois le remplissage effectué, Spanner ajoute la colonne à l'index. À mesure que l'index augmente, les requêtes qui l'utilisent peuvent être ralenties.
L'exemple suivant montre comment supprimer une colonne d'un indice :
GoogleSQL
ALTER INDEX AlbumsByAlbumTitle DROP STORED COLUMN MarketingBudget
PostgreSQL
ALTER INDEX AlbumsByAlbumTitle DROP INCLUDE COLUMN MarketingBudget
Index des valeurs NULL
Par défaut, Spanner indexe les valeurs NULL
. Par exemple, reprenez la définition de l'index SingersByFirstLastName
dans la table Singers
:
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName);
Toutes les lignes de Singers
sont indexées même si FirstName
et/ou LastName
sont NULL
.
Lorsque des valeurs NULL
sont indexées, vous pouvez effectuer des requêtes SQL efficaces et effectuer des lectures sur des données incluant des valeurs NULL
. Par exemple, utilisez cette instruction de requête SQL pour trouver tous les Singers
avec un FirstName
NULL
:
GoogleSQL
SELECT s.SingerId, s.FirstName, s.LastName
FROM Singers@{FORCE_INDEX=SingersByFirstLastName} AS s
WHERE s.FirstName IS NULL;
PostgreSQL
SELECT s.SingerId, s.FirstName, s.LastName
FROM Singers /* @ FORCE_INDEX = SingersByFirstLastName */ AS s
WHERE s.FirstName IS NULL;
Ordre de tri pour les valeurs NULL
Spanner considère la valeur NULL
comme la plus petite valeur possible pour tous les types. Pour une colonne dans l'ordre croissant (ASC
), les valeurs NULL
sont triées en premier. Pour une colonne dans l'ordre décroissant (DESC
), les valeurs NULL
sont triées en dernier.
Désactiver l'indexation des valeurs NULL
GoogleSQL
Pour désactiver l'indexation des valeurs NULL, ajoutez le mot clé NULL_FILTERED
à la définition de l'index. Les index NULL_FILTERED
sont particulièrement utiles pour l'indexation des colonnes partiellement remplies, dont la plupart des lignes contiennent une valeur NULL
. Dans ces cas, l'index NULL_FILTERED
peut être considérablement plus petit et plus simple à maintenir qu'un index normal qui inclut des valeurs NULL
.
Voici une autre définition de SingersByFirstLastName
qui n'indexe pas les valeurs NULL
:
CREATE NULL_FILTERED INDEX SingersByFirstLastNameNoNulls
ON Singers(FirstName, LastName);
Le mot clé NULL_FILTERED
s'applique à toutes les colonnes de la clé d'index. Vous ne pouvez pas spécifier le filtrage des valeurs NULL
par colonne.
PostgreSQL
Pour filtrer les lignes contenant des valeurs nulles dans une ou plusieurs colonnes indexées, utilisez le prédicat WHERE COLUMN IS NOT NULL
.
Les index filtrés par les valeurs nulles sont particulièrement utiles pour l'indexation
de colonnes, dont la plupart des lignes contiennent une valeur NULL
. Dans ces cas, l'index filtré par valeur nulle peut être considérablement plus petit et plus simple à maintenir qu'un index normal qui inclut des valeurs NULL
.
Voici une autre définition de SingersByFirstLastName
qui n'indexe pas les valeurs NULL
:
CREATE INDEX SingersByFirstLastNameNoNulls
ON Singers(FirstName, LastName)
WHERE FirstName IS NOT NULL
AND LastName IS NOT NULL;
Le filtrage des valeurs NULL
empêche Spanner de l'utiliser pour certaines
requêtes. Par exemple, Spanner n'utilise pas l'index pour cette requête,
car l'index omet toutes les lignes Singers
pour lesquelles LastName
est NULL
. en tant que
résultat, l'utilisation de l'index empêcherait la requête de renvoyer les lignes appropriées:
GoogleSQL
FROM Singers@{FORCE_INDEX=SingersByFirstLastNameNoNulls}
WHERE FirstName = "John";
PostgreSQL
FROM Singers /*@ FORCE_INDEX = SingersByFirstLastNameNoNulls */
WHERE FirstName = 'John';
Pour permettre à Spanner d'utiliser l'index, vous devez réécrire la requête afin d'exclure les lignes qui sont également exclues de l'index :
GoogleSQL
SELECT FirstName, LastName
FROM Singers@{FORCE_INDEX=SingersByFirstLastNameNoNulls}
WHERE FirstName = 'John' AND LastName IS NOT NULL;
PostgreSQL
SELECT FirstName, LastName
FROM Singers /*@ FORCE_INDEX = SingersByFirstLastNameNoNulls */
WHERE FirstName = 'John' AND LastName IS NOT NULL;
Champs proto d'index
Utilisez des colonnes générées pour indexer les champs dans les tampons de protocole stockés dans des colonnes PROTO
, à condition que les champs indexés utilisent les types de données primitifs ou ENUM
.
Si vous définissez un index sur un champ de message de protocole, vous ne pouvez ni modifier, ni supprimer ce champ à partir du schéma proto. Pour en savoir plus, consultez Mises à jour des schémas contenant un index sur les champs proto.
Voici un exemple de table Singers
avec une colonne de message proto SingerInfo
. Pour définir un indice sur le champ nationality
de la PROTO
, vous devez créer une colonne générée stockée :
GoogleSQL
CREATE PROTO BUNDLE (googlesql.example.SingerInfo, googlesql.example.SingerInfo.Residence);
CREATE TABLE Singers (
SingerId INT64 NOT NULL,
...
SingerInfo googlesql.example.SingerInfo,
SingerNationality STRING(MAX) AS (SingerInfo.nationality) STORED
) PRIMARY KEY (SingerId);
La définition suivante du type de protocole googlesql.example.SingerInfo
:
GoogleSQL
package googlesql.example;
message SingerInfo {
optional string nationality = 1;
repeated Residence residence = 2;
message Residence {
required int64 start_year = 1;
optional int64 end_year = 2;
optional string city = 3;
optional string country = 4;
}
}
Ensuite, définissez un index sur le champ nationality
du fichier proto:
GoogleSQL
CREATE INDEX SingersByNationality ON Singers(SingerNationality);
La requête SQL suivante lit les données à l'aide de l'index précédent :
GoogleSQL
SELECT s.SingerId, s.FirstName
FROM Singers AS s
WHERE s.SingerNationality = "English";
Remarques :
- Utilisez une directive d'index pour accéder aux index sur les champs des colonnes du protocole de tampon.
- Vous ne pouvez pas créer d'index sur des champs répétés de tampon de protocole.
Mises à jour des schémas contenant un indice sur les champs proto
Si vous définissez un index sur un champ de message de protocole, vous ne pouvez ni modifier, ni supprimer ce champ à partir du schéma proto. En effet, une fois l'index défini, une vérification du type est effectuée à chaque mise à jour du schéma. Spanner capture les informations de type pour tous les champs du chemin d'accès. utilisés dans la définition de l'index.
Index uniques
Les index peuvent être déclarés comme UNIQUE
. Les index UNIQUE
ajoutent une contrainte aux données indexées qui interdit les entrées en double pour une clé d'index donnée.
Cette contrainte est appliquée par Spanner au moment du commit de la transaction.
Plus précisément, toute transaction qui entraînerait l'existence de plusieurs entrées d'index pour une même clé verra son commit échouer.
Si une table contient des données violant la contrainte UNIQUE
, la tentative de création d'un index UNIQUE
échouera.
Remarque sur les index UNIQUE NULL_FILTERED
Un index UNIQUE NULL_FILTERED
n'applique pas l'unicité des clés d'index lorsqu'au moins l'une des parties de la clé de l'index est NULL.
Par exemple, supposons que vous ayez créé la table et l'index suivants :
GoogleSQL
CREATE TABLE ExampleTable (
Key1 INT64 NOT NULL,
Key2 INT64,
Key3 INT64,
Col1 INT64,
) PRIMARY KEY (Key1, Key2, Key3);
CREATE UNIQUE NULL_FILTERED INDEX ExampleIndex ON ExampleTable (Key1, Key2, Col1);
PostgreSQL
CREATE TABLE ExampleTable (
Key1 BIGINT NOT NULL,
Key2 BIGINT,
Key3 BIGINT,
Col1 BIGINT,
PRIMARY KEY (Key1, Key2, Key3)
);
CREATE UNIQUE INDEX ExampleIndex ON ExampleTable (Key1, Key2, Col1)
WHERE Key1 IS NOT NULL
AND Key2 IS NOT NULL
AND Col1 IS NOT NULL;
Les deux lignes suivantes dans ExampleTable
ont les mêmes valeurs pour les clés d'index secondaires Key1
, Key2
et Col1
:
1, NULL, 1, 1
1, NULL, 2, 1
Étant donné que Key2
est NULL
et que l'index est filtré par valeur nulle, les lignes ne seront pas présentes dans l'index ExampleIndex
. Comme elles ne sont pas insérées
, il ne les refusera pas pour non-respect de l'unicité sur (Key1, Key2,
Col1)
.
Si vous souhaitez que l'index applique l'unicité des valeurs du tuple (Key1
,
Key2
, Col1
), alors vous devez annoter Key2
avec NOT NULL
dans la table.
ou créer l'index sans filtrer les valeurs NULL.
Supprimer un index
Utilisez l'instruction DROP INDEX
pour supprimer un index secondaire de votre schéma.
Pour supprimer l'index nommé SingersByFirstLastName
:
DROP INDEX SingersByFirstLastName;
Indexer pour accélérer la recherche
Lorsque Spanner doit effectuer une analyse de table (plutôt qu'une opération indexée recherche) pour récupérer les valeurs d'une ou de plusieurs colonnes, vous pouvez recevoir s'il existe un index pour ces colonnes, et dans l'ordre spécifié par la requête. Si vous effectuez fréquemment des requêtes nécessitant des analyses, envisagez de créer des index secondaires pour optimiser ces analyses.
En particulier, si vous avez besoin que Spanner analyse fréquemment clé primaire ou autre index dans l'ordre inverse, vous pouvez augmenter d'efficacité grâce à un indice secondaire qui rend l'ordre choisi explicite.
Par exemple, la requête suivante renvoie toujours un résultat rapide, même si Spanner doit analyser Songs
pour trouver la valeur la plus basse de SongId
:
SELECT SongId FROM Songs LIMIT 1;
SongId
est la clé primaire de la table, stockée (comme pour toutes les clés primaires) ;
dans l’ordre croissant. Spanner peut analyser l'index de cette clé et trouver rapidement le premier résultat.
Toutefois, sans l'aide d'un indice secondaire, la requête suivante ne serait pas renvoyée aussi rapidement, en particulier si Songs
contient beaucoup de données :
SELECT SongId FROM Songs ORDER BY SongId DESC LIMIT 1;
Même si SongId
est la clé primaire de la table, Spanner ne dispose d'aucune
moyen d'extraire la valeur la plus élevée de la colonne sans avoir à utiliser
l'analyse de la table.
L'ajout de l'index suivant permettrait à cette requête de renvoyer plus rapidement:
CREATE INDEX SongIdDesc On Songs(SongId DESC);
Une fois cet index en place, Spanner l'utiliserait pour renvoyer pour la deuxième requête beaucoup plus rapidement.
Étape suivante
- Découvrez les bonnes pratiques SQL pour Spanner.
- Découvrez les plans d'exécution de requêtes pour Spanner.
- Découvrez comment résoudre les problèmes de régression des performances dans les requêtes SQL.