Chiavi esterne

Questo argomento descrive le chiavi esterne in Spanner e come puoi utilizzarle per applicare l'integrità referenziale nella soluzione di database.

Panoramica

Le chiavi esterne consentono di definire le relazioni tra le tabelle. Spanner garantisce che venga mantenuta l'integrità dei dati di queste relazioni.

Immagina di essere lo sviluppatore principale di un'attività di e-commerce. Stai progettando un database per elaborare gli ordini dei clienti. Il database deve archiviare le informazioni su ogni ordine, cliente e prodotto. La Figura 1 illustra la struttura di base del database per l'applicazione.

Struttura di base del database di elaborazione degli ordini.

Figura 1. Diagramma di un database di elaborazione degli ordini

Devi definire una tabella Customers per archiviare i dati dei clienti, una tabella Orders per tenere traccia di tutti gli ordini effettuati e una tabella Products per archiviare le informazioni su ciascun prodotto che i clienti possono ordinare.

La Figura 1 mostra anche i collegamenti tra le tabelle mappate alle seguenti relazioni reali:

  • Un cliente ha effettuato un ordine

  • È stato effettuato un ordine per un prodotto

Sei tu a decidere che il tuo database deve applicare le seguenti regole per garantire che gli ordini nel nostro sistema siano validi.

  • Impossibile creare un ordine per un cliente che non esiste.

  • Un cliente non può ordinare un prodotto che non hai con te.

Quando applichiamo queste regole o vincoli, affermiamo che stiamo mantenendo l'integrità referenziale dei nostri dati. Quando un database mantiene l'integrità referenziale, tutti i tentativi di aggiungere dati non validi, il che comporterebbe collegamenti non validi o riferimenti tra dati non validi. L'integrità referenziale impedisce gli errori degli utenti. Spanner applica l'integrità referenziale tramite chiavi esterne.

Forza l'integrità referenziale con chiavi esterne

Vediamo di nuovo l'esempio di elaborazione degli ordini, aggiungendo ulteriori dettagli al design, come mostrato nella Figura 2.

Schema del database con chiavi esterne

Figura 2. Diagramma dello schema del nostro database con chiavi esterne

La struttura ora mostra i nomi e i tipi di colonna in ogni tabella. La tabella Orders definisce anche due relazioni di chiave esterna. FK_CustomerOrder garantisce che tutte le righe in Orders abbiano un valore CustomerID valido. La chiave esterna FK_ProductOrder garantisce che tutti i valori ProductID nella tabella Orders siano validi. La seguente tabella mappa questi vincoli alle regole reali che vogliamo applicare.

Nome chiave esterna Vincolo Descrizione reale
FK_CustomerOrder Assicurati che tutte le righe in Orders abbiano un valore CustomerID valido Un ordine è stato effettuato da un cliente valido
FK_ProductOrder Assicurati che tutte le righe in Orders abbiano un valore ProductID valido È stato effettuato un ordine per un prodotto valido

Spanner non va a buon fine per qualsiasi transazione che tenta di inserire o aggiornare una riga della tabella Orders con un valore CustomerID o ProductID non trovato nelle tabelle Customers e Products. Inoltre, non va a buon fine per le transazioni che tentano di aggiornare o eliminare le righe nelle tabelle Customers e Products, il che invalida gli ID nella tabella Orders. Per ulteriori dettagli su come Spanner convalida i vincoli, consulta la sezione Convalida dei vincoli di transazione di seguito.

Definisci le chiavi esterne

Le chiavi esterne vengono create e rimosse dal database Spanner tramite DDL. Le chiavi esterne vengono aggiunte a una nuova tabella con l'istruzione CREATE TABLE. Allo stesso modo, puoi aggiungere o rimuovere una chiave esterna da una tabella esistente con l'istruzione ALTER TABLE. Di seguito è riportato un esempio di creazione di una nuova tabella con una chiave esterna.

GoogleSQL

CREATE TABLE Orders (
  OrderID INT64 NOT NULL,
  CustomerID INT64 NOT NULL,
  Quantity INT64 NOT NULL,
  ProductID INT64 NOT NULL,
  CONSTRAINT FK_CustomerOrder FOREIGN KEY (CustomerID) REFERENCES Customers (CustomerID)
) PRIMARY KEY (OrderID);

PostgreSQL

CREATE TABLE Orders (
  OrderID BIGINT NOT NULL,
  CustomerID BIGINT NOT NULL,
  Quantity BIGINT NOT NULL,
  ProductID BIGINT NOT NULL,
  CONSTRAINT FK_CustomerOrder FOREIGN KEY (CustomerID) REFERENCES Customers (CustomerID),
  PRIMARY KEY (OrderID)
);

Per altri esempi su come creare e gestire le chiavi esterne, consulta Creare e gestire relazioni di chiave esterna.

Di seguito è riportato un elenco delle caratteristiche delle chiavi esterne in Spanner.

  • La tabella che definisce la chiave esterna è la tabella di riferimento, mentre le colonne di chiave esterna sono le colonne di riferimento.

  • La chiave esterna fa riferimento alle colonne riferite della tabella riferita.

  • Come nell'esempio precedente, puoi assegnare un nome a ogni vincolo di chiave esterna. Se non specifichi un nome, Spanner ne genera uno automaticamente. È possibile eseguire query sul nome generato da INFORMATION_SCHEMA di Spanner. I nomi dei vincoli hanno come ambito lo schema, insieme ai nomi di tabelle e indici, ad esempio e devono essere univoci all'interno dello schema.

  • Il numero di colonne di riferimento deve essere lo stesso. L'ordine è significativo. La prima colonna di riferimento si riferisce alla prima colonna di riferimento, la seconda alla seconda e così via.

  • Una colonna di riferimento e la rispettiva controparte a cui viene fatto riferimento devono essere dello stesso tipo. Anche le colonne devono essere indicizzabili.

  • Non è possibile creare chiavi esterne nelle colonne con l'opzione allow_commit_timestamp=true.

  • Le colonne di array non sono supportate.

  • Le colonne JSON non sono supportate.

  • Una chiave esterna può fare riferimento a colonne della stessa tabella (una chiave esterna "autoreferenziale"). Un esempio è una tabella Employee con una colonna ManagerId che fa riferimento alla colonna EmployeeId della tabella.

  • Le chiavi esterne possono anche formare relazioni circolari tra le tabelle in cui due tabelle fanno riferimento l'una all'altra, direttamente o indirettamente. La tabella a cui viene fatto riferimento deve esistere prima della creazione di una chiave esterna, quindi è necessario aggiungerla con l'istruzione ALTER TABLE.

  • Le chiavi a cui viene fatto riferimento devono essere univoche. Spanner utilizza PRIMARY KEY della tabella di riferimento se le colonne di riferimento della chiave esterna corrispondono alle colonne di chiave primaria della tabella di riferimento. Se Spanner non può utilizzare la chiave primaria della tabella di riferimento, crea un UNIQUE NULL_FILTERED INDEX sulle colonne di riferimento.

  • Spanner potrebbe anche essere in grado di usare la chiave primaria della tabella di riferimento, sebbene sia meno comune. In caso contrario, Spanner crea un NULL_FILTERED INDEX sulle colonne di riferimento.

  • Le chiavi esterne non utilizzano indici secondari che hai creato, ma creano i propri indici di supporto. Questi indici di supporto possono essere utilizzati nella valutazione delle query, incluse istruzioni esplicite force_index. È possibile eseguire query sui nomi degli indici di supporto da INFORMATION_SCHEMA di Spanner. Per ulteriori informazioni, consulta Indici di backup.

Azioni chiave esterne

Le azioni delle chiavi esterne ti consentono di controllare cosa succede alla colonna vincolata quando la colonna a cui fa riferimento viene eliminata o aggiornata. Spanner supporta l'uso dell'azione ON DELETE CASCADE. Con l'azione ELIMINA CASCATA della chiave esterna, quando elimini una riga che contiene una chiave esterna di riferimento, anche tutte le righe che fanno riferimento a quella chiave vengono eliminate nella stessa transazione.

Puoi aggiungere una chiave esterna con un'azione quando crei il database utilizzando il DDL. Utilizza l'istruzione CREATE TABLE per aggiungere chiavi esterne con un'azione a una nuova tabella. Analogamente, puoi utilizzare l'istruzione ALTER TABLE per aggiungere un'azione di chiave esterna a una tabella esistente o per rimuoverla. Di seguito è riportato un esempio di come creare una nuova tabella con un'azione di chiave esterna.

GoogleSQL

CREATE TABLE Customers (
  CustomerId INT64 NOT NULL,
  CustomerName STRING(MAX) NOT NULL,
) PRIMARY KEY(CustomerId);

CREATE TABLE ShoppingCarts (
  CartId INT64 NOT NULL,
  CustomerId INT64 NOT NULL,
  CustomerName STRING(MAX) NOT NULL,
  CONSTRAINT FKShoppingCartsCustomers FOREIGN KEY(CustomerId, CustomerName)
    REFERENCES Customers(CustomerId, CustomerName) ON DELETE CASCADE,
) PRIMARY KEY(CartId);

PostgreSQL

CREATE TABLE Customers (
  CustomerId bigint NOT NULL,
  CustomerName character varying(1024) NOT NULL,
  PRIMARY KEY(CustomerId)
);

CREATE TABLE ShoppingCarts (
  CartId bigint NOT NULL,
  CustomerId bigint NOT NULL,
  CustomerName character varying(1024) NOT NULL,
  PRIMARY KEY(CartId),
  CONSTRAINT fkshoppingcartscustomers FOREIGN KEY (CustomerId, CustomerName)
    REFERENCES Customers(CustomerId, CustomerName) ON DELETE CASCADE
);

Di seguito è riportato un elenco delle caratteristiche delle azioni di chiave esterna in Spanner.

  • Le azioni delle chiavi esterne possono essere ON DELETE CASCADE o ON DELETE NO ACTION.

  • Puoi eseguire una query su INFORMATION_SCHEMA per trovare i vincoli di chiave esterna che hanno un'azione.

  • L'aggiunta di un'azione di chiave esterna a un vincolo di chiave esterna esistente non è supportata. Devi aggiungere un nuovo vincolo di chiave esterna con un'azione.

Modifiche allo schema di lunga durata

L'aggiunta di una chiave esterna a una tabella esistente o la creazione di una nuova tabella con una chiave esterna può portare a operazioni a lunga esecuzione. Nel caso di una nuova tabella, non è possibile scrivere fino al completamento dell'operazione a lunga esecuzione.

Per una nuova tabella con una chiave esterna, Spanner deve eseguire il backfill degli indici di riferimento in base alle esigenze di ogni chiave esterna.

Per una tabella esistente con una chiave esterna, Spanner deve eseguire il backfill degli indici di riferimento e di riferimento in base alle esigenze. Inoltre, Spanner convalida i dati esistenti nella tabella per garantire che sia conforme al vincolo di integrità referenziale della chiave esterna. La modifica dello schema non va a buon fine se alcuni dati non sono validi.

L'aggiunta di un'azione di chiave esterna a un vincolo esistente non è supportata. Ti suggeriamo di procedere nel seguente modo:

  1. Aggiungi un nuovo vincolo con azione.
  2. Elimina il vincolo precedente senza azione.

In questo modo si evita un problema di Long-running Alter Constraint Operation. Dopo aver creato la nuova chiave esterna con l'azione ON DELETE CASCADE, l'effetto netto di entrambi i vincoli è ELIMINA CASCATA. L'eliminazione di un vincolo potrebbe comportare l'eliminazione degli indici di supporto della chiave esterna se questi non sono utilizzati in altri vincoli di chiave esterna. In seguito, se l'utente aggiunge lo stesso vincolo di chiave esterna con l'azione, potrebbero essere necessarie operazioni a lunga esecuzione, tra cui il backfill degli indici, la convalida di vincoli di indice univoci e la convalida dei vincoli referenziali di chiave esterna.

Entrambe le modifiche allo schema riportate sopra possono non riuscire se l'indice a cui viene fatto riferimento non può essere creato a causa di una violazione del vincolo UNIQUE.

Puoi eseguire una query su INFORMATION_SCHEMA.REFERENTIAL_CONSTRAINTS.SPANNER_STATE per controllare lo stato di creazione della chiave esterna.

Convalida del vincolo per una transazione

Spanner convalida i vincoli di chiave esterna quando viene eseguito il commit di una transazione o quando gli effetti delle scritture vengono resi visibili alle operazioni successive nella transazione.

Un valore inserito nelle colonne di riferimento viene confrontato con i valori della tabella e delle colonne di riferimento a cui viene fatto riferimento. Le righe con NULL che fanno riferimento non vengono controllate, ovvero puoi aggiungerle alla tabella di riferimento.

Spanner convalida tutti i vincoli referenziali di chiave esterna applicabili quando si tenta di aggiornare i dati tramite istruzioni DML o un'API. Viene eseguito il rollback di tutte le modifiche in attesa se alcuni vincoli non sono validi.

La convalida avviene immediatamente dopo ogni istruzione DML. Ad esempio, devi inserire la riga di riferimento prima di inserire le relative righe. Quando si utilizza un'API Mutazione, le mutazioni vengono memorizzate nel buffer fino al commit della transazione. La convalida delle chiavi esterne viene differita fino al commit della transazione. In questo caso è consentito inserire prima le righe di riferimento.

Ogni transazione viene valutata per verificare la presenza di modifiche che influiscono sui vincoli di chiave esterna. Queste valutazioni potrebbero richiedere richieste aggiuntive al server. Gli indici di supporto richiedono anche tempi di elaborazione aggiuntivi per valutare le modifiche alle transazioni e per mantenere gli indici. È richiesto anche spazio di archiviazione aggiuntivo per ogni indice.

Indici di supporto

Le chiavi esterne non utilizzano indici creati dall'utente. Creano i propri indici di supporto.

Spanner può creare fino a due indici di supporto secondari per ogni chiave esterna, uno per le colonne di riferimento e un secondo per le colonne di riferimento. Tuttavia, una chiave esterna di solito fa riferimento alle chiavi primarie della tabella di riferimento, quindi il secondo indice nella tabella a cui viene fatto riferimento solitamente non è necessario.

L'indice di supporto per la tabella a cui viene fatto riferimento è un indice UNIQUE NULL_FILTERED; la creazione della chiave esterna non va a buon fine se i dati esistenti violano il vincolo di univocità dell'indice. L'indice di supporto per la tabella di riferimento è NULL_FILTERED.

Se due o più chiavi esterne richiedono lo stesso indice di supporto, Spanner creerà un singolo indice per tutte. Gli indici di supporto vengono eliminati quando vengono eliminate le chiavi esterne che li utilizzano. Gli utenti non possono modificare o eliminare gli indici di supporto.

Spanner utilizza lo schema di informazioni di ogni database per archiviare i metadati relativi agli indici di supporto. Le righe all'interno di INFORMATION_SCHEMA.INDEXES con un valore SPANNER_IS_MANAGED pari a true descrivono gli indici di supporto.

Al di fuori delle query SQL che richiamano direttamente lo schema delle informazioni, la console Google Cloud non mostra altre informazioni sugli indici di supporto di un database.

Azione a cascata di eliminazione a lunga durata

Quando elimini una riga da una tabella di riferimento, Spanner deve eliminare tutte le righe delle tabelle di riferimento che fanno riferimento alla riga eliminata. Ciò può portare a un effetto a cascata, in cui una singola operazione di eliminazione può comportare migliaia di altre operazioni di eliminazione. L'aggiunta di un vincolo di chiave esterna con azione a cascata di eliminazione in una tabella o la creazione di una tabella con vincoli di chiave esterna con l'azione di eliminazione a cascata può rallentare le operazioni di eliminazione.

Limite di mutazione superato per l'eliminazione a cascata della chiave esterna

L'eliminazione di un numero elevato di record mediante una cascata di eliminazione di una chiave esterna può influire sulle prestazioni. Questo perché ogni record eliminato attiva l'eliminazione di tutti i record correlati che utilizzano chiavi esterne. Se il numero di mutazioni in una transazione supera 80.000, la transazione non va a buon fine.

Se devi eliminare un numero elevato di record utilizzando un'eliminazione a cascata della chiave esterna, devi eliminare esplicitamente le righe dalle tabelle figlio prima di eliminare la riga dalle tabelle padre. Ciò impedisce che la transazione vada a buon fine a causa del limite di mutazione.

Confronto di chiavi esterne e interfoliazione delle tabelle

L'interfoliazione delle tabelle di Spanner è una buona scelta per molte relazioni padre-figlio in cui la chiave primaria della tabella figlio include le colonne di chiave primaria della tabella padre. La colocation delle righe figlio e delle righe padre può migliorare notevolmente le prestazioni.

Le chiavi esterne sono una soluzione padre-figlio più generale e rispondono a ulteriori casi d'uso. Non si limitano alle colonne di chiave primaria e le tabelle possono avere più relazioni di chiave esterna, sia come padre in alcune relazioni che come figlio in altre. Tuttavia, una relazione di chiave esterna non implica la colocation delle tabelle nel livello di archiviazione.

Osserviamo un esempio, utilizzando lo schema di elaborazione degli ordini di cui abbiamo parlato in precedenza. Ricorda che la nostra tabella Orders è stata definita come segue:

Schema del database con chiavi esterne

Figura 3. Diagramma dello schema del nostro database con chiavi esterne

Il design nella Figura 3 presenta alcune limitazioni. Ad esempio, ciascun ordine al momento può contenere un solo articolo.

Supponiamo che i nostri clienti ci dicano che vorrebbero poter ordinare più di un prodotto per ordine. Possiamo migliorare il nostro design introducendo una tabella OrderItems che contiene una voce per ogni prodotto ordinato dal cliente. Possiamo introdurre un'altra chiave esterna per rappresentare questa nuova relazione one-to-many tra Orders e OrderItems. Tuttavia, sappiamo anche che molto spesso è necessario eseguire query sugli ordini e sui rispettivi articoli dell'ordine. La colocation di questi dati migliorerebbe le prestazioni, quindi creeremo la relazione padre-figlio utilizzando la funzionalità di interfoliazione delle tabelle di Spanner.

Ecco come definiamo la tabella OrderItems, con interlacciata con Orders.

GoogleSQL

CREATE TABLE OrderItems (
  OrderID INT64 NOT NULL,
  ProductID INT64 NOT NULL,
  Quantity INT64 NOT NULL,
  FOREIGN KEY (ProductID) REFERENCES Products (ProductID)
) PRIMARY KEY (OrderID, ProductID),
  INTERLEAVE IN PARENT Orders ON DELETE CASCADE;

PostgreSQL

CREATE TABLE OrderItems (
  OrderID BIGINT NOT NULL,
  ProductID BIGINT NOT NULL,
  Quantity BIGINT NOT NULL,
  FOREIGN KEY (ProductID) REFERENCES Products (ProductID),
  PRIMARY KEY (OrderID, ProductID)
) INTERLEAVE IN PARENT Orders ON DELETE CASCADE;

La Figura 4 è una rappresentazione visiva dello schema aggiornato del database a seguito dell'introduzione di questa nuova tabella, OrderItems, con interlacciata con Orders. Qui puoi anche vedere la relazione one-to-many tra queste due tabelle.

Schema di database che mostra una relazione one-to-many tra Orders e la nuova tabella OrderItems con interfoliazione

Figura 4. Aggiunta di una tabella OrderItems con interleaving

In questa configurazione, possiamo avere più voci OrderItems in ogni ordine e le voci OrderItems per ogni ordine sono interlealate e, di conseguenza, si trovano insieme agli ordini. L'interlacciamento fisico di Orders e OrderItems in questo modo può migliorare le prestazioni, eseguendo efficacemente il pre-unione delle tabelle e consentendo di accedere insieme alle righe correlate riducendo al minimo gli accessi ai dischi. Ad esempio, Spanner può eseguire i join mediante chiave primaria localmente, riducendo al minimo l'accesso al disco e il traffico di rete.

Se il numero di mutazioni in una transazione supera 80.000, la transazione non va a buon fine. Le eliminazioni a cascata così grandi funzionano bene per le tabelle con una relazione "con interleaving nel padre", ma non per le tabelle con una relazione di chiave esterna. Se hai una relazione di chiave esterna e devi eliminare un numero elevato di righe, devi prima eliminarle in modo esplicito dalle tabelle figlio.

Se hai una tabella utente con una relazione di chiave esterna con un'altra tabella e l'eliminazione di una riga dalla tabella di riferimento attiva l'eliminazione di milioni di righe, devi progettare lo schema con un'azione di eliminazione a cascata con "interleaving nel padre".

Tabella di confronto

La seguente tabella riassume le differenze tra le chiavi esterne e l'interfoliazione delle tabelle. Puoi usare queste informazioni per decidere qual è la scelta giusta per il tuo progetto.

Tipo di relazione genitore-figlio Interfoliazione dei tavoli Chiavi esterne
Possono usare chiavi primarie
È possibile utilizzare colonne non a chiave primaria No
Numero di genitori supportati 0 ... 1 0 .. N
Archivia i dati principali e secondari No
Supporta l'eliminazione a cascata
Modalità di corrispondenza nulla Viene superato se tutti i valori che fanno riferimento non sono distinti dai valori di riferimento.
I valori null non sono distinti dai valori null. I valori null sono distinti dai valori non null.
Viene inviato se un qualsiasi valore di riferimento è null.
Viene superato se tutti i valori di riferimento sono diversi da null e la tabella di riferimento ha una riga con valori uguali a quelli di riferimento.
Non riesce se non è stata trovata alcuna riga corrispondente.
Tempi di applicazione Per operazione quando si utilizza l'API Mutazione.
Per istruzione quando utilizzi DML.
Per transazione quando si utilizza l'API Mutazione.
Per istruzione quando utilizzi DML.
Possono essere rimossi facilmente No. L'interfoliazione delle tabelle non può essere rimossa dopo la creazione, a meno che non elimini l'intera tabella figlio.

Passaggi successivi