Este tópico descreve as chaves estrangeiras no Spanner e como usá-las para impor a integridade de referência na solução de banco de dados.
Visão geral
As chaves externas permitem definir relações entre tabelas. O Spanner garante que a integridade de dados desses relacionamentos seja mantida.
Imagine que você seja o desenvolvedor líder de um negócio de comércio eletrônico. Você está projetando um banco de dados para processar pedidos dos clientes. O banco de dados precisa armazenar informações sobre cada pedido, cliente e produto. A figura 1 ilustra a estrutura de banco de dados básica do aplicativo.
Figura 1. Diagrama de um banco de dados de processamento de pedidos
Você define uma tabela Customers
para armazenar informações do cliente, uma tabela Orders
para acompanhar todos os pedidos feitos e uma tabela Products
para armazenar informações sobre cada produto que os clientes possam pedir.
A figura 1 também mostra links entre as tabelas que mapeiam aos seguintes relacionamentos reais:
Um cliente fez um pedido
Um produto foi solicitado
Você decide que seu banco de dados precisa aplicar as regras a seguir para garantir que os pedidos em nosso sistema sejam válidos.
Não é possível criar um pedido para um cliente que não existe.
Um cliente não pode fazer um pedido de um produto que você não tem disponível.
Quando aplicamos essas regras, ou restrições, dizemos que estamos mantendo a integridade referencial dos nossos dados. Quando um banco de dados mantém a integridade referencial, todas as tentativas de adicionar dados inválidos, o que resultaria em links ou referências inválidas entre os dados, falharão. A integridade referencial evita erros do usuário. O Spanner aplica a integridade referencial por meio de chaves estrangeiras.
Aplicar integridade referencial com chaves estrangeiras
Vejamos nosso exemplo de processamento de pedidos novamente, com mais detalhes adicionados ao projeto, conforme mostrado na Figura 2.
Figura 2. Diagrama do nosso esquema de banco de dados com chaves estrangeiras
O design agora mostra nomes e tipos de colunas em cada tabela. A tabela Orders
também define dois relacionamentos de chave estrangeira. FK_CustomerOrder
garante que todas
as linhas em Orders
tenham um CustomerID
válido. A chave estrangeira FK_ProductOrder
garante que todos os valores ProductID
na tabela Orders
sejam válidos. A
tabela a seguir mapeia essas restrições de volta às regras reais que queremos
aplicar.
Nome da chave estrangeira | Restrição | Descrição real |
---|---|---|
FK_CustomerOrder | Garante que todas as linhas em Orders tenham um
CustomerID válido |
Um cliente válido fez um pedido |
FK_ProductOrder | Garante que todas as linhas em Orders tenham um
ProductID válido. |
Um produto válido foi solicitado |
O Spanner falha em qualquer transação que tente inserir ou atualizar uma linha na
tabela Orders
que tenha um CustomerID
ou ProductID
não encontrado nas
tabelas Customers
e Products
. Ele também falha em transações que tentam
atualizar ou excluir linhas nas tabelas Customers
e Products
que invalidariam
os IDs na tabela Orders
. Para mais detalhes sobre como
o Spanner valida restrições, consulte a Validação de restrição
de transação abaixo.
Definir chaves estrangeiras
As chaves externas são criadas e removidas do banco de dados do Spanner
usando DDL. As chaves estrangeiras são adicionadas a uma nova tabela com a instrução CREATE
TABLE
. Da mesma forma, é possível adicionar ou remover uma chave estrangeira de uma tabela atual com a instrução ALTER TABLE
. Veja a seguir um exemplo de como criar uma nova tabela com uma chave estrangeira.
GoogleSQL
CREATE TABLE Orders (
OrderID INT64 NOT NULL,
CustomerID INT64 NOT NULL,
Quantity INT64 NOT NULL,
ProductID INT64 NOT NULL,
CONSTRAINT FK_CustomerOrder FOREIGN KEY (CustomerID) REFERENCES Customers (CustomerID)
) PRIMARY KEY (OrderID);
PostgreSQL
CREATE TABLE Orders (
OrderID BIGINT NOT NULL,
CustomerID BIGINT NOT NULL,
Quantity BIGINT NOT NULL,
ProductID BIGINT NOT NULL,
CONSTRAINT FK_CustomerOrder FOREIGN KEY (CustomerID) REFERENCES Customers (CustomerID),
PRIMARY KEY (OrderID)
);
Para mais exemplos de como criar e gerenciar chaves estrangeiras, consulte Criar e gerenciar relações de chaves estrangeiras.
Veja a seguir uma lista de características das chaves externas no Spanner.
A tabela que define a chave estrangeira é a tabela de referência, e as colunas de chave estrangeira são as colunas de referência.
A chave estrangeira faz referência às colunas referenciadas da tabela referenciada.
Como no exemplo acima, você pode nomear cada restrição de chave estrangeira. Se você não especificarem um nome, o Spanner gera um nome automaticamente. O nome gerado pode ser consultado no INFORMATION_SCHEMA do Spanner. Os nomes das restrições têm como escopo o esquema, além dos nomes das tabelas e índices, por exemplo. Eles precisam ser exclusivos dentro do esquema.
O número de colunas de referência e referenciadas precisa ser o mesmo. A ordem é significativa. A primeira coluna de referência se refere à primeira coluna referenciada, a segunda à segunda etc.
As colunas de referência e a contraparte referenciada precisam ser do mesmo tipo. As colunas também precisam ser indexáveis.
Não é possível criar chaves estrangeiras em colunas com a opção
allow_commit_timestamp=true
.As colunas da matriz não são compatíveis.
Colunas JSON não são compatíveis.
Uma chave externa pode fazer referência a colunas da mesma tabela (uma chave externa de "referência própria"). Um exemplo é uma tabela "Employee" com uma coluna "ManagerId" que faz referência à coluna "EmployeeId" da tabela.
As chaves estrangeiras também podem formar relações circulares entre tabelas, em que duas tabelas fazem referência umas às outras, de maneira direta ou indireta. A tabela referenciada precisa existir antes da criação de uma chave estrangeira. Portanto, pelo menos uma dessas chaves precisa ser adicionada usando a instrução
ALTER TABLE
.As chaves referenciadas precisam ser exclusivas. O Spanner vai usar o
PRIMARY KEY
da tabela referenciada se as colunas referenciadas da chave estrangeira corresponderem às colunas da chave primária da tabela referenciada. Se o Spanner não puder usar a chave primária da tabela referenciada, ele criará umUNIQUE NULL_FILTERED INDEX
sobre as colunas referenciadas.O Spanner também pode usar a chave primária do modelo da tabela, embora isso seja menos comum. Caso contrário, o Spanner cria um
NULL_FILTERED INDEX
nas colunas de referência.Chaves estrangeiras não usam índices secundários criados. Criam seus próprios índices de backup. Esses índices de backup podem ser usados em avaliações de consulta, incluindo em diretivas force_index explícitas. O nome dos índices de backup pode ser consultado no INFORMATION_SCHEMA do Spanner. Para mais informações, consulte Índices de backup.
Ações de chave estrangeira
As ações de chave estrangeira permitem controlar o que acontece com a coluna restrita quando a coluna referenciada é excluída ou atualizada. Spanner. suporta o uso da ação ON DELETE CASCADE. Com a chave externa ATIVADA DELETE CASCADE, quando você exclui uma linha que contém um idioma estrangeiro chave, todas as linhas que fazem referência a essa chave também são excluídas na mesma transação.
É possível adicionar uma chave estrangeira com
uma ação ao criar o banco de dados usando DDL. Usar o CREATE TABLE
para adicionar chaves estrangeiras com uma ação a uma nova tabela. Da mesma forma, você pode
usar a instrução ALTER TABLE
para adicionar uma ação de chave estrangeira a uma tabela
existente ou remover uma ação de chave estrangeira. Confira a seguir um exemplo de como
criar uma nova tabela com uma ação de chave estrangeira.
GoogleSQL
CREATE TABLE Customers (
CustomerId INT64 NOT NULL,
CustomerName STRING(MAX) NOT NULL,
) PRIMARY KEY(CustomerId);
CREATE TABLE ShoppingCarts (
CartId INT64 NOT NULL,
CustomerId INT64 NOT NULL,
CustomerName STRING(MAX) NOT NULL,
CONSTRAINT FKShoppingCartsCustomers FOREIGN KEY(CustomerId, CustomerName)
REFERENCES Customers(CustomerId, CustomerName) ON DELETE CASCADE,
) PRIMARY KEY(CartId);
PostgreSQL
CREATE TABLE Customers (
CustomerId bigint NOT NULL,
CustomerName character varying(1024) NOT NULL,
PRIMARY KEY(CustomerId)
);
CREATE TABLE ShoppingCarts (
CartId bigint NOT NULL,
CustomerId bigint NOT NULL,
CustomerName character varying(1024) NOT NULL,
PRIMARY KEY(CartId),
CONSTRAINT fkshoppingcartscustomers FOREIGN KEY (CustomerId, CustomerName)
REFERENCES Customers(CustomerId, CustomerName) ON DELETE CASCADE
);
Confira a seguir uma lista de características de ações de chaves estrangeiras no Spanner.
As ações de chaves estrangeiras são ON DELETE CASCADE ou ON DELETE NO ACTION.
É possível consultar o INFORMATION_SCHEMA para encontrar restrições de chave estrangeira que têm uma ação.
Não é possível adicionar uma ação de chave externa a uma restrição atual suporte. Você precisa adicionar uma nova restrição de chave externa com uma ação.
Alterações de esquema de longa duração
Adicionar uma chave estrangeira a uma tabela atual ou criar uma nova tabela com uma chave estrangeira pode levar a operações de longa duração. No caso de uma nova tabela, ela não pode ser gravada até que a operação de longa duração seja concluída.
Para uma nova tabela com uma chave estrangeira, o Spanner precisa preencher os índices referenciados conforme necessário para cada chave estrangeira.
Para uma tabela com uma chave estrangeira, o Spanner precisa preencher os índices de referência e referenciados conforme necessário. Além disso, o Spanner valida os dados atuais na tabela para garantir a conformidade com a restrição de integridade de referência da chave estrangeira. A mudança de esquema falhará se houver dados inválidos.
Não é possível adicionar uma ação de chave externa a uma restrição atual. Sugerimos que você faça o seguinte:
- Adicione uma nova restrição com ação.
- Exclua a restrição mais antiga sem ação.
Isso evita um problema de Long-running Alter Constraint Operation
. Depois de criar
a nova chave estrangeira com a ação ON DELETE CASCADE, o efeito líquido de ambas as
restrições é DELETE CASCADE. O descarte de uma restrição pode levar ao
índices de suporte de chave estrangeira se os índices não estiverem em uso em outra chave externa
restrições. Mais tarde, se o usuário adicionar a mesma restrição de chave externa com
ação, isso poderá exigir operações de execução demorada, incluindo o preenchimento de índices,
a validação de restrições de índice exclusivas e a validação de restrições de chave externa
referencial.
Qualquer uma das alterações de esquema acima pode falhar se o índice referenciado não puder ser criado devido a uma violação de restrição UNIQUE
.
Consulte INFORMATION_SCHEMA.REFERENTIAL_CONSTRAINTS.SPANNER_STATE para verificar o estado da criação de chave estrangeira.
Validação de restrição para uma transação
O Spanner valida as restrições de chave estrangeira quando uma transação está sendo confirmada ou quando os efeitos das gravações estão visíveis para operações subsequentes na transação.
Um valor inserido nas colunas de referência é comparado com os valores da
tabela referenciada e das colunas referenciadas. Linhas com NULL
que fazem referência a valores
não estão marcadas, ou seja, é possível adicioná-las à tabela de referência.
O Spanner valida todas as restrições referenciais de chave externa aplicáveis ao tentar atualizar dados por meio de instruções DML ou de uma API. Todas as alterações pendentes serão revertidas se alguma restrição for inválida.
A validação ocorre imediatamente após cada instrução DML. Por exemplo, é preciso inserir a linha referenciada antes de inserir as linhas de referência. Ao usar uma API de mutação, as mutações são armazenadas em buffer até que a transação seja confirmada. A validação de chave estrangeira é adiada até a confirmação da transação. Nesse caso, é permitido inserir primeiro as linhas de referência.
Cada transação é avaliada quanto a modificações que afetam as restrições de chave estrangeira. Essas avaliações podem exigir outras solicitações ao servidor. Os índices de backup também exigem mais tempo de processamento para avaliar as modificações de transação e manter os índices. O armazenamento extra também é necessário para cada índice.
Índices de backup
As chaves estrangeiras não usam índices criados pelo usuário. Elas criam seus próprios índices de backup.
O Spanner pode criar até dois índices de backup secundários para cada chave estrangeira, um para as colunas de referência e um segundo para as colunas referenciadas. No entanto, uma chave estrangeira geralmente faz referência às chaves primárias da tabela referenciada. Portanto, o segundo índice na tabela referenciada normalmente não é necessário.
O índice de backup da tabela referenciada é um índice UNIQUE NULL_FILTERED
. A criação da chave estrangeira falhará se algum dado violar a restrição de exclusividade do índice. O índice de backup da tabela de referência é NULL_FILTERED
.
Se duas ou mais chaves estrangeiras exigirem o mesmo índice de backup, o Spanner criará um único índice para todas elas. Os índices de backup são descartados quando as chaves estrangeiras que os utilizam são descartadas. Os usuários não podem alterar ou descartar os índices de backup.
O Spanner usa o esquema de informações de cada banco de dados para armazenar
metadados sobre índices de apoio. Linhas em INFORMATION_SCHEMA.INDEXES
com um valor SPANNER_IS_MANAGED
de true
descrevem os índices de apoio.
Fora das consultas SQL que invocam diretamente o esquema de informações, a classe O console do Google Cloud não exibe nenhuma informação os índices de backup de um banco de dados.
Ação de exclusão em cascata de longa duração
Quando você exclui uma linha de uma tabela referenciada, o Spanner precisa excluir todas as linhas nas tabelas de referência que fazem referência à linha excluída. Isso pode levar a um efeito cascata, em que uma única operação de exclusão pode resultar em milhares de outras operações de exclusão. Como adicionar uma restrição de chave externa com cascata de exclusão em uma tabela ou criando uma tabela com restrições chave externa com delete a ação em cascata pode retardar as operações de exclusão.
Limite de mutação excedido para a cascata de exclusão de chave externa
Excluir um grande número de registros usando uma cascata de exclusão de chave externa pode impactar o desempenho. Isso ocorre porque cada registro excluído aciona a exclusão de todos os registros relacionados a ele que estão usando chaves estrangeiras. Se o número de mutações em uma transação exceder 80.000, a transação vai falhar.
Se você precisar excluir um grande número de registros usando uma chave externa, exclua cascata, você deve excluir explicitamente as linhas das tabelas-filho antes excluindo a linha das tabelas pai. Isso impede que a transação falha devido ao limite de mutação.
Comparação de chaves estrangeiras e intercalação de tabelas
A intercalação de tabelas do Spanner é uma boa opção para vários modelos relações em que a chave primária da tabela filha inclui o valor colunas de chave primária. A localização mútua das linhas filho com as linhas pai pode melhorar significativamente o desempenho.
As chaves estrangeiras são uma solução pai-filho mais geral e abordam outros casos de uso. Elas não estão limitadas a colunas de chave primária, e as tabelas podem ter várias relações de chave estrangeira, como pai em alguns relacionamentos e filho em outros. No entanto, uma relação de chave estrangeira não sugere a colocalização das tabelas na camada de armazenamento.
Vejamos um exemplo, usando o esquema de processamento de pedidos discutido anteriormente
neste tópico. Lembre-se de que nossa tabela Orders
foi definida da seguinte maneira:
Figura 3. Diagrama do nosso esquema de banco de dados com chaves estrangeiras
O design na Figura 3 tem algumas limitações. Por exemplo, cada pedido pode conter apenas um item.
Imagine que nossos clientes nos diga que querem solicitar mais
de um produto por pedido. Podemos melhorar nosso design introduzindo uma
tabela OrderItems
que contenha uma entrada para cada produto solicitado pelo cliente. Podemos apresentar outra chave estrangeira para representar essa nova relação de um para muitos
entre Orders
e OrderItems
. No entanto, também sabemos que boa parte do
tempo é necessário executar consultas entre os pedidos e os respectivos itens
de pedido. A colocalização desses dados melhoraria a performance. Por isso, vamos criar a
relação pai-filha usando o recurso de intercalação de tabelas do Spanner.
Veja como definimos a tabela OrderItems
, intercalada com Orders
.
GoogleSQL
CREATE TABLE OrderItems (
OrderID INT64 NOT NULL,
ProductID INT64 NOT NULL,
Quantity INT64 NOT NULL,
FOREIGN KEY (ProductID) REFERENCES Products (ProductID)
) PRIMARY KEY (OrderID, ProductID),
INTERLEAVE IN PARENT Orders ON DELETE CASCADE;
PostgreSQL
CREATE TABLE OrderItems (
OrderID BIGINT NOT NULL,
ProductID BIGINT NOT NULL,
Quantity BIGINT NOT NULL,
FOREIGN KEY (ProductID) REFERENCES Products (ProductID),
PRIMARY KEY (OrderID, ProductID)
) INTERLEAVE IN PARENT Orders ON DELETE CASCADE;
A Figura 4 é uma representação visual do esquema de banco de dados atualizado como resultado
da introdução dessa nova tabela, OrderItems
, intercalada com Orders
. Aqui você
também pode ver a relação de um para muitos entre essas duas tabelas.
Figura 4 Adição de uma tabela intercalada "OrderItems"
Nessa configuração, é possível haver várias entradas OrderItems
em cada pedido, e as entradas OrderItems
de cada pedido são intercaladas e, portanto, colocalizadas com os pedidos. Intercalar fisicamente Orders
e OrderItems
dessa maneira pode melhorar o desempenho, mesclando previamente as tabelas e permitindo que você acesse linhas relacionadas, ao mesmo tempo que minimiza os acessos ao disco. Para
por exemplo, o Spanner pode realizar junções por chave primária localmente, minimizando
acesso ao disco e tráfego de rede.
Se o número de mutações em uma transação exceder 80.000, a transação vai falhar. Essas exclusões em cascata grandes funcionam bem para tabelas com uma relação "intercalada na mãe", mas não para tabelas com uma relação de chave estrangeira. Se você tem um relacionamento de chave externa e precisa excluir um um grande número de linhas, é preciso excluir explicitamente as linhas do tabelas.
Se você tem uma tabela de usuário com uma relação chave externa com outra tabela e excluir uma linha da tabela referenciada aciona a exclusão de milhões de linhas, você deve projetar seu esquema com uma ação em cascata de exclusão com "intercalado na mãe".
Tabela de comparação
A tabela a seguir mostra um resumo comparando as chaves estrangeiras e a intercalação de tabelas. Use essas informações para decidir o que é melhor para seu projeto.
Tipo de relação pai-filho | Intercalação de tabelas | Chaves estrangeiras |
---|---|---|
Pode usar chaves primárias | Sim | Sim |
Pode usar colunas não primárias | Não | Sim |
Número de pais compatíveis | 0 .. 1 | 0 .. N |
Armazena dados pai e filho juntos | Sim | Não |
Compatível com exclusão em cascata | Sim | Sim |
Modo de correspondência nulo | Aprovado se todos os valores de referênciaforem iguais aos valores referenciados. Valores nulos não são diferentes de valores nulos. Os valores nulos são diferentes dos valores não nulos. |
Aprovado se algum valor de referência for nulo. Aprovado se todos os valores de referência não forem nulos e a tabela referenciada tiver uma linha com valores iguais aos valores de referência. Ocorre uma falha se nenhuma linha correspondente for encontrada. |
Tempo de aplicação | Por operação ao usar a API de mutação. Por instrução ao usar DML. |
Por transação ao usar a API de mutação. Por instrução ao usar DML. |
Pode ser removido facilmente | Não. Não é possível remover a intercalação de tabelas após a criação, a menos que você exclua a tabela filha inteira. | Sim |
A seguir
Saiba mais sobre Como criar e gerenciar relacionamentos de chave estrangeira.
Saiba mais sobre o esquema de informações.