Gestion des valeurs par défaut de la clé primaire

Cette page décrit les stratégies à utiliser pour générer des valeurs de clé primaire dans votre table à l'aide d'expressions de valeur par défaut. Les informations de cette page s'appliquent aux bases de données en dialecte Google SQL et en dialecte PostgreSQL. Ces stratégies présentent les avantages suivants:

  • Empêcher le hotspotting
  • Simplifier les migrations à partir d'autres bases de données
  • Encapsulez la logique de clé dans la base de données afin de ne pas avoir à vous soucier de la gérer dans votre application.
  • Dans la plupart des cas, vous n'avez plus besoin de créer et de gérer vos propres séquences.

Méthodes de génération automatique de clés primaires

Pour générer automatiquement des valeurs de clé primaire, vous pouvez utiliser les stratégies suivantes dans une colonne contenant des expressions DEFAULT:

  • Fonction UUID qui génère des valeurs UUID de la version 4.
  • Objet de schéma, SEQUENCE, avec une option bit_reversed_positive. SEQUENCE est disponible pour GoogleSQL et PostgreSQL.

Méthodes de génération automatique de clés primaires

Cette section explique comment générer automatiquement des UUID et des séquences inversées à utiliser comme valeurs de clés primaires.

Identifiant unique universel (UUID)

Spanner peut générer automatiquement une chaîne UUID de version 4 à utiliser comme clé primaire. Les UUID sont adaptés aux nouvelles applications et aux tables comportant de nombreuses lignes. Ils sont répartis de manière à peu près uniforme dans l'espace de clés, ce qui évite les points chauds à grande échelle. La génération d'UUID peut créer un grand nombre de valeurs (2122), et chaque valeur est effectivement unique. Par exemple, vous auriez besoin de 2,71 × 1018 valeurs pour une probabilité de collision de 50 %, soit 1 milliard par seconde pendant 86 ans. Cela garantit des valeurs uniques lorsque vous l'utilisez dans de grandes tables. Les UUID sont uniques, que vous les génériez dans la base de données ou dans le client. Nous vous recommandons d'utiliser des UUID dans la mesure du possible. Vous pouvez mélanger en toute sécurité des UUID générés par le client et par Spanner dans la même table si les UUID générés par le client sont sérialisés en minuscules, conformément à la RFC 4122.

Pour une colonne qui nécessite des valeurs par défaut, vous pouvez utiliser la fonction GENERATE_UUID pour les générer. L'exemple suivant montre comment créer une table dans laquelle la colonne de clé FanId a GENERATE_UUID comme valeur par défaut dans la colonne de valeur. L'exemple utilise 36 caractères pour les attributs STRING Google SQL et varchar PostgreSQL, car les UUID comportent 36 caractères. Lorsque vous utilisez l'instruction INSERT with THEN RETURN pour insérer des données dans la table Fans, GENERATE_UUID génère et renvoie une valeur UUID pour FanId.

GoogleSQL

CREATE TABLE Fans (
  FanId STRING(36) DEFAULT (GENERATE_UUID()),
  Name STRING(MAX),
) PRIMARY KEY (FanId);

PostgreSQL

CREATE TABLE Fans (
  FanId varchar(36) DEFAULT spanner.generate_uuid(),
  Name text,
  PRIMARY KEY (FanId)
);

GoogleSQL

INSERT INTO Fans (Name) VALUES ('Melissa Garcia')
THEN RETURN FanId;

PostgreSQL

INSERT INTO fans (name) VALUES ('Melissa Garcia')
RETURNING (fanid);

Cette instruction renvoie un résultat semblable à celui-ci:

FanId
6af91072-f009-4c15-8c42-ebe38ae83751

Pour en savoir plus sur la fonction GENERATE_UUID(), consultez la page de référence GoogleSQL ou PostgreSQL.

IDENTITY colonnes

Avec les colonnes IDENTITY, vous pouvez générer automatiquement des valeurs entières pour les colonnes clés et non clés. Les colonnes IDENTITY ne nécessitent pas que les utilisateurs gèrent manuellement une séquence sous-jacente ni gèrent la relation entre la colonne et la séquence sous-jacente. Lorsqu'une colonne d'identité générée automatiquement est supprimée, la séquence sous-jacente est également automatiquement supprimée.

Vous pouvez utiliser des colonnes IDENTITY en fournissant une valeur entière de début lors de la génération de la séquence ou en laissant Spanner générer la séquence entière à votre place. Pour fournir une valeur entière de début, vous devez utiliser l'option START COUNTER WITH et une valeur de début INT64 positive. Spanner utilise cette valeur pour définir la valeur suivante pour son compteur de séquence interne généré automatiquement et inverse la valeur avant de l'insérer dans cette colonne.

Dans Spanner, les colonnes IDENTITY sont compatibles avec Google SQL et PostgreSQL.

GoogleSQL

L'exemple suivant montre comment utiliser des colonnes IDENTITY pour créer une colonne de clé primaire entière générée automatiquement pour SingerId lorsque vous créez une table à l'aide de la commande CREATE TABLE:

CREATE TABLE Singers (
  SingerId INT64 GENERATED BY DEFAULT AS IDENTITY (BIT_REVERSED_POSITIVE),
  Name STRING(MAX),
  Rank INT64
) PRIMARY KEY (SingerId);

Vous pouvez également spécifier le début du compteur pour la colonne à l'aide de l'option START_WITH_COUNTER. Dans l'exemple suivant, une colonne d'entiers générée automatiquement est créée pour SingerId,qui comporte des valeurs positives inversées et un compteur interne qui commence à 1 000.

CREATE TABLE Singers (
  SingerId INT64 GENERATED BY DEFAULT AS IDENTITY (BIT_REVERSED_POSITIVE START COUNTER WITH 1000),
  Name STRING(MAX),
  Rank INT64
) PRIMARY KEY (SingerId);

PostgreSQL

L'exemple suivant montre comment utiliser des colonnes IDENTITY pour créer une colonne d'entiers générée automatiquement pour SingerId lorsque vous créez une table à l'aide de la commande CREATE TABLE:

CREATE TABLE Singers (
  SingerId bigint GENERATED BY DEFAULT AS IDENTITY (BIT_REVERSED_POSITIVE),
  Name text,
  PRIMARY KEY (SingerId)
);

Vous pouvez également spécifier le début du compteur pour la colonne à l'aide de l'option START COUNTER WITH. Dans l'exemple suivant, une colonne d'entiers générée automatiquement est créée pour SingerId, qui génère des valeurs positives inversées par bits, et le compteur interne, avant l'inversion des bits, commence à 1 000.

CREATE TABLE Singers (
  SingerId bigint GENERATED BY DEFAULT AS IDENTITY (BIT_REVERSED_POSITIVE START COUNTER WITH 1000),
  Name text,
  PRIMARY KEY (SingerId)
);

SERIAL et AUTO_INCREMENT

Spanner est compatible avec SERIAL dans PostgreSQL et AUTO_INCREMENT dans GoogleSQL, qui sont des alias DDL pour les colonnes IDENTITY et sont utilisés pour créer des colonnes d'entiers uniques. Vous devez d'abord définir l'option default_sequence_kind de la base de données avant d'utiliser SERIAL ou AUTO_INCREMENT. Vous pouvez utiliser l'instruction SQL suivante pour définir l'option default_squence_kind de la base de données:

GoogleSQL

ALTER DATABASE db SET OPTIONS (default_sequence_kind = 'bit_reversed_positive');

CREATE TABLE Singers (
  id INT64 AUTO_INCREMENT PRIMARY KEY,
  name STRING(MAX),
)

PostgreSQL

ALTER DATABASE db SET spanner.default_sequence_kind = 'bit_reversed_positive';

CREATE TABLE Singers (
  id serial PRIMARY KEY,
  name text
);

Notez que, comme SERIAL et AUTO_INCREMENT sont mappés sur des colonnes IDENTITY, vous ne les verrez pas lorsque vous sérialiserez votre schéma. Pour ce schéma, la sortie de GetDatabaseDDL est la suivante:

GoogleSQL

ALTER DATABASE db SET OPTIONS (default_sequence_kind = 'bit_reversed_positive');

CREATE TABLE Singers (
  id INT64 GENERATED BY DEFAULT AS IDENTITY,
  name STRING(MAX),
) PRIMARY KEY (id);

PostgreSQL

ALTER DATABASE db SET spanner.default_sequence_kind = 'bit_reversed_positive';

CREATE TABLE Singers (
  id bigint GENERATED BY DEFAULT AS IDENTITY NOT NULL,
  name character varying,
  PRIMARY KEY(id)
);

Séquence inversée

Une séquence inversée est un objet de schéma qui produit une séquence d'entiers et les inverse. Cet objet utilise l'inversion de bits sur un compteur Spanner interne et privé pour garantir l'unicité. Les valeurs inversées qui en résultent permettent d'éviter les hotspots à grande échelle lorsqu'elles sont utilisées dans une clé primaire.

Dans Spanner, vous utilisez des instructions DDL SEQUENCE avec l'attribut bit_reversed_positive pour créer, modifier ou supprimer une séquence qui produit des valeurs positives inversées (GoogleSQL ou PostgreSQL).

Chaque séquence gère un ensemble de compteurs internes et les utilise pour générer une valeur. Le compteur de séquence fournit l'entrée à l'algorithme de renversement de bits.

Lorsque vous définissez une colonne avec une expression DEFAULT qui utilise la fonction GET-NEXT-SEQUENCE-VALUE GoogleSQL ou la fonction nextval PostgreSQL comme valeur par défaut, Spanner appelle automatiquement la fonction et place les valeurs de sortie inversées dans la colonne. Les séquences inversées sont particulièrement utiles pour les clés primaires, car les valeurs inversées sont réparties uniformément dans l'espace de clés afin qu'elles ne provoquent pas de points chauds.

L'exemple suivant montre comment créer une séquence inversée et une table dont la colonne de clé utilise la séquence comme valeur par défaut:

GoogleSQL

CREATE SEQUENCE SingerIdSequence OPTIONS (
  sequence_kind="bit_reversed_positive"
);

CREATE TABLE Singers (
  SingerId INT64 DEFAULT (GET_NEXT_SEQUENCE_VALUE(SEQUENCE SingerIdSequence)),
  Name STRING(MAX),
  Rank INT64,
) PRIMARY KEY (SingerId);

PostgreSQL

CREATE SEQUENCE SingerIdSequence bit_reversed_positive;

CREATE TABLE Singers (
  SingerId bigint DEFAULT nextval('SingerIdSequence'),
  Name text,
  PRIMARY KEY (SingerId)
);

Vous pouvez ensuite utiliser l'instruction SQL suivante pour insérer et renvoyer la valeur de clé primaire:

GoogleSQL

INSERT INTO Singers (Name) VALUES ('Melissa Garcia')
THEN RETURN SingerId;

PostgreSQL

INSERT INTO Singers (name) VALUES ('Melissa Garcia')
RETURNING (SingerId);

Cette instruction renvoie un résultat semblable à celui-ci:

SingerId
3458764513820540928

Scénarios d'utilisation d'UUID et de séquences comme valeurs par défaut pour les clés primaires

Les scénarios pour les UUID et les séquences incluent les suivants:

  • Nouvelles applications
  • Migrations

Les sections suivantes décrivent chaque scénario.

Nouvelles applications

Si votre application existante nécessite des clés INT64 dans GoogleSQL ou des clés bigint dans PostgreSQL, Spanner propose l'objet de schéma de séquence positive inversée par bits (PostgreSQL ou GoogleSQL). Sinon, pour les nouvelles applications, nous vous recommandons d'utiliser un identifiant unique universel (UUID). Pour en savoir plus, consultez Utiliser un identifiant unique universel (UUID).

Migrations

Pour migrer des tables vers Spanner, vous disposez de plusieurs options:

  • Si vous utilisez des UUID dans votre base de données source, sur Spanner, vous pouvez utiliser une colonne de clé de type STRING et la fonction GENERATE_UUID() (GoogleSQL ou PostgreSQL) comme valeur par défaut.
  • Si vous utilisez une clé primaire entière et que votre application n'a besoin que de la clé pour être unique, vous pouvez utiliser une colonne de clé dans INT64 et une séquence positive inversée pour la valeur par défaut de la clé primaire. Consultez Migrer des colonnes de clés inversées.
  • Spanner ne permet pas de générer des valeurs monotones.

    Si vous utilisez une clé monotone, telle que le type SERIAL PostgreSQL ou l'attribut AUTO_INCREMENT MySQL, et que vous avez besoin de nouvelles clés monotones sur Spanner, vous pouvez utiliser une clé composite. Pour en savoir plus, consultez les pages Permuter l'ordre des clés et Hacher la clé unique et répartir les écritures sur des segments logiques.

  • Si votre application inverse manuellement la clé INT64 dans GoogleSQL ou la clé bigint dans PostgreSQL, vous pouvez utiliser une séquence positive inversée (GoogleSQL ou PostgreSQL) et lui demander de générer de nouvelles valeurs de clé. Pour en savoir plus, consultez la section Migrer des colonnes de clés inversées.

Étape suivante