Una colonna generata è una colonna che viene sempre calcolata da altre colonne in una riga. Queste colonne possono semplificare una query, risparmiare sui costi di valutazione di un'espressione al momento della query e possono essere indicizzate o utilizzate come chiavi esterne. In questo articolo viene descritto come gestire questo tipo di colonna nel tuo database.
Aggiungere una colonna generata a una nuova tabella
Nel seguente snippet CREATE TABLE
, creiamo una tabella
per archiviare le informazioni sugli utenti. Abbiamo colonne per FirstName
e LastName
e definiamo una colonna generata per FullName
, che è la concatenazione di FirstName
e LastName
SQL di Google
CREATE TABLE Users (
Id STRING(20) NOT NULL,
FirstName STRING(50),
LastName STRING(50),
Age INT64 NOT NULL,
FullName STRING(100) AS (ARRAY_TO_STRING([FirstName, LastName], " ")) STORED,
) PRIMARY KEY (Id);
PostgreSQL
CREATE TABLE users (
id VARCHAR(20) NOT NULL,
firstname VARCHAR(50),
lastname VARCHAR(50),
age BIGINT NOT NULL,
fullname VARCHAR(100) GENERATED ALWAYS AS (firstname || ' ' || lastname) STORED,
PRIMARY KEY(id)
);
Il valore di FullName
viene calcolato quando viene inserita una nuova riga o quando vengono aggiornati FirstName
e/o LastName
per una riga esistente. Il valore calcolato viene memorizzato insieme ad altre colonne della tabella. L'SQL tra parentesi è chiamato espressione di generazione.
expression
può essere qualsiasi espressione SQL valida assegnabile al tipo di dati della colonna con le seguenti limitazioni.L'espressione può fare riferimento solo a colonne della stessa tabella.
L'espressione non può contenere sottoquery.
L'espressione non può contenere funzioni non deterministiche come
PENDING_COMMIT_TIMESTAMP()
,CURRENT_DATE()
eCURRENT_TIMESTAMP()
.Non puoi modificare l'espressione di una colonna generata.
L'attributo
STORED
che segue l'espressione causa l'archiviazione del risultato della funzione insieme ad altre colonne della tabella. I successivi aggiornamenti di una qualsiasi delle colonne di riferimento fanno sì che l'espressione venga rivalutata e archiviata.Le colonne generate senza l'attributo
STORED
non sono consentite.Non sono consentite scritture dirette nelle colonne generate.
Le colonne generate non possono essere utilizzate come o come parte di una chiave primaria. Tuttavia, possono essere chiavi di indice secondarie.
L'opzione Colonna
allow_commit_timestamp
non è consentita su colonne generate o a cui viene fatto riferimento in colonne generate.Non puoi modificare il tipo di dati di una colonna generata o nessuna colonna a cui fa riferimento la colonna generata.
Non puoi rilasciare una colonna a cui viene fatto riferimento in una colonna generata.
Puoi eseguire query su una colonna generata come qualsiasi altra colonna, come mostrato nell'esempio seguente.
SQL di Google
SELECT Id, FullName
FROM Users;
PostgreSQL
SELECT id, fullname
FROM users;
Equivale alla seguente istruzione, che non utilizza la colonna generata.
SQL di Google
SELECT Id, ARRAY_TO_STRING([FirstName, LastName], " ") as FullName
FROM Users;
PostgreSQL
SELECT id, firstname || ' ' || lastname as fullname
FROM users;
Oltre a semplificare la query e a risparmiare sui costi di valutazione dell'espressione al momento della query, una colonna generata può essere indicizzata o utilizzata come chiave esterna.
Creare un indice su una colonna generata
Per aiutarti con le ricerche nella colonna generata FullName
, possiamo creare un indice secondario come mostrato nello snippet seguente.
SQL di Google
CREATE INDEX UsersByFullName ON Users (FullName);
PostgreSQL
CREATE INDEX UserByFullName ON users (fullname);
Aggiungere una colonna generata a una tabella esistente
Utilizzando la seguente istruzione ALTER TABLE
, aggiungiamo una colonna generata alla tabella Users
per generare e archiviare le iniziali dell'utente.
SQL di Google
ALTER TABLE Users ADD COLUMN Initials STRING(2)
AS (ARRAY_TO_STRING([SUBSTR(FirstName, 0, 1), SUBSTR(LastName, 0, 1)], "")) STORED;
PostgreSQL
ALTER TABLE users ADD COLUMN Initials VARCHAR(2)
GENERATED ALWAYS AS (SUBSTR(FirstName, 0, 1) || SUBSTR(LastName, 0, 1)) STORED;
L'aggiunta di una colonna generata archiviata a una tabella esistente è un'operazione a lunga esecuzione per eseguire il backfill dei valori della colonna. Durante il backfill, non è possibile leggere o eseguire query sulle colonne generate. Lo stato di backfill si riflette in INFORMATION_SCHEMA.
Creare un indice parziale utilizzando una colonna generata
E se volessimo eseguire query solo per gli utenti che hanno più di 18 anni? Una scansione completa della tabella non sarebbe efficiente, pertanto utilizziamo un indice parziale.
Utilizza la seguente istruzione per aggiungere un'altra colonna generata che restituisce l'età dell'utente se ha più di 18 anni e, in caso contrario, restituisce
NULL
.SQL di Google
ALTER TABLE Users ADD COLUMN AgeAbove18 INT64 AS (IF(Age > 18, Age, NULL)) STORED;
PostgreSQL
ALTER TABLE Users ADD COLUMN AgeAbove18 BIGINT GENERATED ALWAYS AS (nullif( Age , least( 18, Age) )) STORED;
Crea un indice in questa nuova colonna e disattiva l'indicizzazione dei valori
NULL
con la parola chiaveNULL_FILTERED
in GoogleSQL o il predicatoIS NOT NULL
in PostgreSQL. Questo indice parziale è più piccolo e più efficiente di un indice normale perché esclude tutti gli utenti di almeno 18 anni.SQL di Google
CREATE NULL_FILTERED INDEX UsersAbove18ByAge ON Users (AgeAbove18);
PostgreSQL
CREATE INDEX UsersAbove18ByAge ON users (AgeAbove18) WHERE AgeAbove18 IS NOT NULL;
Per recuperare
Id
eAge
di tutti gli utenti di età superiore a 18 anni, esegui la query seguente.SQL di Google
SELECT Id, Age FROM Users@{FORCE_INDEX=UsersAbove18ByAge} WHERE AgeAbove18 IS NOT NULL;
PostgreSQL
SELECT Id, Age FROM users /*@ FORCE_INDEX = UsersAbove18ByAge */ WHERE AgeAbove18 IS NOT NULL;
Per applicare un filtro in base a un'età diversa, ad esempio per recuperare tutti gli utenti con più di 21 anni, utilizza lo stesso indice e filtro nella colonna generata come segue:
SQL di Google
SELECT Id, Age FROM Users@{FORCE_INDEX=UsersAbove18ByAge} WHERE AgeAbove18 > 21;
PostgreSQL
SELECT Id, Age FROM users /*@ FORCE_INDEX = UsersAbove18ByAge */ WHERE AgeAbove18 > 21;
Rimuovere una colonna generata
La seguente istruzione DDL elimina una colonna generata dalla tabella Users
.
ALTER TABLE Users
DROP COLUMN Initials;
Modificare un'espressione di colonna generata
Non è consentita la modifica dell'espressione di una colonna generata. Devi eliminare la colonna esistente e crearne una nuova con la nuova espressione.
Visualizzare le proprietà di una colonna generata
INFORMATION_SCHEMA di Spanner contiene informazioni sulle colonne generate nel database. Di seguito sono riportati alcuni esempi di domande a cui puoi rispondere eseguendo una query sullo schema di informazioni.
Quali colonne generate sono definite nel mio database?
SELECT c.TABLE_NAME, c.COLUMN_NAME
FROM INFORMATION_SCHEMA.COLUMNS as c
WHERE c.GENERATION_EXPRESSION IS NOT NULL;
Qual è lo stato corrente delle colonne generate nella tabella Users
?
Se hai aggiunto una colonna generata a una tabella esistente, ti consigliamo di visualizzare lo stato attuale per determinare, ad esempio, se la colonna è stata sottoposta a backfill e completamente utilizzabile. Se SPANNER_STATE
restituisce WRITE_ONLY
nella query seguente, significa che Spanner è ancora in fase di backfill della colonna e non sono consentite letture.
SQL di Google
SELECT c.TABLE_NAME, c.COLUMN_NAME, c.SPANNER_STATE
FROM INFORMATION_SCHEMA.COLUMNS AS c
WHERE c.TABLE_NAME="Users" AND c.GENERATION_EXPRESSION IS NOT NULL;
PostgreSQL
SELECT c.TABLE_NAME, c.COLUMN_NAME, c.SPANNER_STATE
FROM INFORMATION_SCHEMA.COLUMNS AS c
WHERE c.TABLE_NAME='users' AND c.GENERATION_EXPRESSION IS NOT NULL;
Passaggi successivi
Scopri di più sulla funzionalità INFORMATION SCHEMA di Spanner.
Visualizza ulteriori dettagli sulle colonne generate nel parametro CREATE TABLE.