Em um banco de dados do Spanner, o Spanner cria automaticamente um
índice para cada chave primária da tabela. Por exemplo, você não precisa fazer nada
para indexar a chave primária de Singers
, porque ela é indexada automaticamente para você.
Também é possível criar índices secundários para outras colunas. Adicionar um índice secundário a uma coluna torna mais eficiente para procurar dados nessa coluna. Por
exemplo, se você precisar procurar rapidamente um álbum por título, crie
um índice secundário em AlbumTitle
.
Assim, o Spanner não precisa verificar a tabela inteira.
Se a pesquisa no exemplo anterior for feita em uma transação de leitura e gravação,
a pesquisa mais eficiente também evita reter bloqueios em toda a tabela,
o que permite inserções e atualizações simultâneas na tabela para linhas fora do
intervalo de pesquisa AlbumTitle
.
Além dos benefícios que eles trazem para as pesquisas, os índices secundários também podem ajudar o Spanner a executar verificações de maneira mais eficiente, permitindo verificações de índice em vez de verificações de tabela completas.
O Spanner armazena os seguintes dados em cada índice secundário:
- Todas as colunas de chave da tabela base
- Todas as colunas incluídas no índice
- Todas as colunas especificadas na cláusula
STORING
opcional (bancos de dados com dialeto do GoogleSQL) ouINCLUDE
(bancos de dados com dialeto do PostgreSQL) da definição do índice.
Com o tempo, o Spanner analisa suas tabelas para garantir que os índices secundários sejam usados para as consultas apropriadas.
Adicionar um índice secundário
O momento mais eficiente para adicionar um índice secundário é quando você cria a tabela. Para criar uma tabela e os índices ao mesmo tempo, envie as instruções DDL para a nova tabela e os novos índices em uma única solicitação para o Spanner.
No Spanner, também é possível adicionar um novo índice secundário a uma tabela existente enquanto o banco de dados continua a veicular o tráfego. Como qualquer outra alteração de esquema no Spanner, adicionar um índice a um banco de dados existente não exige que o banco de dados fique off-line e não bloqueia colunas ou tabelas inteiras.
Sempre que um novo índice é adicionado a uma tabela, o Spanner automaticamente preenche o índice para refletir uma visualização atualizada dos dados que estão sendo indexados. O Spanner gerencia esse processo de preenchimento para você, e o processo é executado em segundo plano usando recursos de nó com baixa prioridade. Na maioria dos casos, não é possível acelerar o processo (por exemplo, adicionando mais nós), e o preenchimento não afeta significativamente o desempenho do banco de dados.
O tempo de criação do índice pode variar de minutos a muitas horas. Como a criação do índice é uma atualização de esquema, ele está sujeito às mesmas restrições de desempenho que qualquer outra atualização de esquema. O tempo necessário para criar um índice secundário depende de vários fatores:
- O tamanho do conjunto de dados
- A capacidade de computação da instância
- da carga na instância.
Para ver o progresso de um processo de preenchimento de índice, consulte a seção de progresso.
Esteja ciente de que usar a coluna confirmar carimbo de data/hora como a primeira parte do índice secundário pode criar pontos de acesso e reduzir o desempenho de gravação.
Use a instrução CREATE INDEX
para definir um índice secundário
no esquema. Veja alguns exemplos:
Para indexar todos os Singers
no banco de dados pelo nome e sobrenome:
GoogleSQL
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName);
PostgreSQL
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName);
Para criar um índice de todos Songs
no banco de dados pelo valor de SongName
:
GoogleSQL
CREATE INDEX SongsBySongName ON Songs(SongName);
PostgreSQL
CREATE INDEX SongsBySongName ON Songs(SongName);
Para indexar somente as músicas de um determinado cantor, use a cláusula INTERLEAVE IN
para intercalar o índice na tabela Singers
:
GoogleSQL
CREATE INDEX SongsBySingerSongName ON Songs(SingerId, SongName),
INTERLEAVE IN Singers;
PostgreSQL
CREATE INDEX SongsBySingerSongName ON Songs(SingerId, SongName)
INTERLEAVE IN Singers;
Para indexar apenas as canções de um álbum específico:
GoogleSQL
CREATE INDEX SongsBySingerAlbumSongName ON Songs(SingerId, AlbumId, SongName),
INTERLEAVE IN Albums;
PostgreSQL
CREATE INDEX SongsBySingerAlbumSongName ON Songs(SingerId, AlbumId, SongName)
INTERLEAVE IN Albums;
Para indexar por ordem decrescente de SongName
:
GoogleSQL
CREATE INDEX SongsBySingerAlbumSongNameDesc ON Songs(SingerId, AlbumId, SongName DESC),
INTERLEAVE IN Albums;
PostgreSQL
CREATE INDEX SongsBySingerAlbumSongNameDesc ON Songs(SingerId, AlbumId, SongName DESC)
INTERLEAVE IN Albums;
A anotação DESC
anterior se aplica apenas a SongName
. Para indexar por ordem decrescente de outras chaves de índice, anote-as com DESC
também: SingerId DESC, AlbumId DESC
.
Observe também que PRIMARY_KEY
é uma palavra reservada e não pode ser usada como o nome de um índice. É o nome dado ao pseudoíndice, que é criado quando uma tabela com a especificação PRIMARY KEY é criada
Para mais detalhes e práticas recomendadas para escolher índices não intercalados e intercalados, consulte Opções de índice e Usar um índice intercalado em uma coluna cujo valor aumenta ou diminui monotonicamente.
Verificar o progresso do preenchimento do índice
Console
No menu de navegação do Spanner, clique na guia Operações. A página Operações mostra uma lista das operações em execução.
Encontre a operação de preenchimento na lista. Se ainda estiver em execução, o indicador de progresso na coluna End time vai mostrar a porcentagem da operação concluída, conforme mostrado na imagem a seguir:
gcloud
Use gcloud spanner operations describe
para verificar o progresso de uma operação.
Consiga o ID da operação:
gcloud spanner operations list --instance=INSTANCE-NAME \ --database=DATABASE-NAME --type=DATABASE_UPDATE_DDL
Substitua:
- INSTANCE-NAME com o nome da instância do Spanner.
- DATABASE-NAME pelo nome do banco de dados.
Observações sobre o uso:
Para limitar a lista, especifique a sinalização
--filter
. Exemplo:--filter="metadata.name:example-db"
lista apenas as operações em um banco de dados específico.--filter="error:*"
lista apenas as operações de backup que falharam.
Para informações sobre a sintaxe do filtro, consulte gcloud topic filtros. Para informações sobre como filtrar operações de backup, consulte o campo
filter
em ListBackupOperationsRequest.A sinalização
--type
não diferencia maiúsculas de minúsculas.
A saída será assim:
OPERATION_ID STATEMENTS DONE @TYPE _auto_op_123456 CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName) False UpdateDatabaseDdlMetadata CREATE INDEX SongsBySingerAlbumSongName ON Songs(SingerId, AlbumId, SongName), INTERLEAVE IN Albums _auto_op_234567 True CreateDatabaseMetadata
Execute
gcloud spanner operations describe
:gcloud spanner operations describe \ --instance=INSTANCE-NAME \ --database=DATABASE-NAME \ projects/PROJECT-NAME/instances/INSTANCE-NAME/databases/DATABASE-NAME/operations/OPERATION_ID
Substitua:
- INSTANCE-NAME: o nome da instância do Spanner.
- DATABASE-NAME: o nome do banco de dados do Spanner.
- PROJECT-NAME: o nome do projeto.
- OPERATION-ID: o ID da operação que você quer verificar.
A seção
progress
na saída mostra a porcentagem da operação que foi concluída. A saída será semelhante a esta:done: true ... progress: - endTime: '2021-01-22T21:58:42.912540Z' progressPercent: 100 startTime: '2021-01-22T21:58:11.053996Z' - progressPercent: 67 startTime: '2021-01-22T21:58:11.053996Z' ...
REST v1
Consiga o ID da operação:
gcloud spanner operations list --instance=INSTANCE-NAME
--database=DATABASE-NAME --type=DATABASE_UPDATE_DDL
Substitua:
- INSTANCE-NAME com o nome da instância do Spanner.
- DATABASE-NAME pelo nome do banco de dados.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- PROJECT-ID: o ID do projeto.
- INSTANCE-ID: o ID da instância
- DATABASE-ID: o ID do banco de dados.
- OPERATION-ID: o ID da operação.
Método HTTP e URL:
GET https://spanner.googleapis.com/v1/projects/PROJECT-ID/instances/INSTANCE-ID/databases/DATABASE-ID/operations/OPERATION-ID
Para enviar a solicitação, expanda uma destas opções:
Você receberá uma resposta JSON semelhante a esta:
{ ... "progress": [ { "progressPercent": 100, "startTime": "2023-05-27T00:52:27.366688Z", "endTime": "2023-05-27T00:52:30.184845Z" }, { "progressPercent": 100, "startTime": "2023-05-27T00:52:30.184845Z", "endTime": "2023-05-27T00:52:40.750959Z" } ], ... "done": true, "response": { "@type": "type.googleapis.com/google.protobuf.Empty" } }
Para gcloud
e REST, você pode encontrar o progresso de cada instrução de preenchimento de índice
na seção progress
. Para cada instrução na matriz de instruções,
há um campo correspondente na matriz de progresso. Essa ordem de matriz de progresso
corresponde à ordem da matriz de instruções. Quando disponíveis, os campos
startTime
, progressPercent
e endTime
são preenchidos de acordo.
A saída não mostra um tempo estimado para a conclusão do preenchimento.
Se a operação demorar muito, você pode cancelá-la. Para mais informações, consulte Cancelar a criação de índice.
Cenários ao visualizar o progresso do preenchimento do índice
Há diferentes cenários que você pode encontrar ao tentar verificar o progresso de um preenchimento de índice. As instruções de criação de índice que exigem um preenchimento de índice fazem parte de operações de atualização de esquema, e pode haver várias instruções que fazem parte de uma operação de atualização de esquema.
O primeiro cenário é o mais simples, que é quando a instrução de criação do índice é a primeira na operação de atualização do esquema. Como a instrução de criação do índice é a primeira, ela é a primeira a ser processada e executada devido à ordem de execução.
Imediatamente, o campo startTime
da instrução de criação do índice será preenchido com o horário de início da operação de atualização do esquema. Em seguida, o campo progressPercent
da instrução de criação do índice é preenchido quando o progresso do preenchimento do índice é superior a 0%. Por fim, o campo endTime
é preenchido quando
a instrução é confirmada.
O segundo cenário é quando a instrução de criação do índice não é a primeira
instrução na operação de atualização do esquema. Nenhum campo relacionado à instrução de criação
do índice será preenchido até que as instruções anteriores tenham sido
confirmadas devido à
ordem de execução.
Semelhante ao cenário anterior, depois que as instruções anteriores forem confirmadas, o campo startTime
da instrução de criação do índice será preenchido primeiro, seguido pelo campo progressPercent
. Por fim, o campo endTime
é preenchido quando a
instrução termina de ser confirmada.
Cancelar a criação do índice
Use a Google Cloud CLI para cancelar a criação de índices. Para recuperar uma lista de operações de atualização de esquema para um banco de dados do Spanner, use o comando gcloud spanner operations list
e inclua a opção --filter
:
gcloud spanner operations list \
--instance=INSTANCE \
--database=DATABASE \
--filter="@TYPE:UpdateDatabaseDdlMetadata"
Encontre o OPERATION_ID
para a operação que você quer cancelar, use o comando gcloud spanner operations cancel
para cancelá-lo:
gcloud spanner operations cancel OPERATION_ID \
--instance=INSTANCE \
--database=DATABASE
Conferir índices
Para conferir informações sobre índices em um banco de dados, use o console do Google Cloud ou a Google Cloud CLI:
Console
Acesse a página Instâncias do Spanner no console do Google Cloud .
Clique no nome da instância que quer exibir.
No painel esquerdo, clique no banco de dados que você quer visualizar e clique na tabela que você quer visualizar.
Clique na guia Índices. O console do Google Cloud mostra uma lista de índices.
Opcional: para detalhes sobre um índice, como as colunas incluídas, clique no nome do índice.
gcloud
Use o comando gcloud spanner databases ddl describe
:
gcloud spanner databases ddl describe DATABASE \
--instance=INSTANCE
A CLI gcloud imprime as instruções da linguagem de definição de dados (DDL)
para criar as tabelas e os índices do banco de dados. As instruções CREATE
INDEX
descrevem os índices existentes. Exemplo:
--- |-
CREATE TABLE Singers (
SingerId INT64 NOT NULL,
FirstName STRING(1024),
LastName STRING(1024),
SingerInfo BYTES(MAX),
) PRIMARY KEY(SingerId)
---
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName)
Consultar com um índice específico
As seções a seguir explicam como especificar um índice em uma instrução SQL e
com a interface de leitura do Spanner. Os exemplos nessas seções presumem que você adicionou uma coluna MarketingBudget
à tabela Albums
e criou um índice chamado AlbumsByAlbumTitle
:
GoogleSQL
CREATE TABLE Albums (
SingerId INT64 NOT NULL,
AlbumId INT64 NOT NULL,
AlbumTitle STRING(MAX),
MarketingBudget INT64,
) PRIMARY KEY (SingerId, AlbumId),
INTERLEAVE IN PARENT Singers ON DELETE CASCADE;
CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle);
PostgreSQL
CREATE TABLE Albums (
SingerId BIGINT NOT NULL,
AlbumId BIGINT NOT NULL,
AlbumTitle VARCHAR,
MarketingBudget BIGINT,
PRIMARY KEY (SingerId, AlbumId)
) INTERLEAVE IN PARENT Singers ON DELETE CASCADE;
CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle);
Especificar um índice em uma instrução SQL
Quando você usa SQL para consultar uma tabela do Spanner, o Spanner usa automaticamente
os índices que provavelmente tornarão a consulta mais eficiente. Como resultado, você não precisa especificar um índice para consultas SQL. No entanto,
para consultas essenciais à sua carga de trabalho, o Google aconselha a utilização de
diretivas FORCE_INDEX
nas instruções SQL para um desempenho mais consistente.
Em alguns casos, o Spanner pode escolher um índice que faz com que a latência da consulta aumente. Se você seguiu as etapas de solução de problemas para regressões de desempenho e confirmou que convém tentar um índice diferente para a consulta, especifique o índice como parte de sua consulta.
Para especificar um índice em uma instrução SQL, use a sugestão FORCE_INDEX
para fornecer uma diretiva de índice. As diretivas de índice usam a seguinte sintaxe:
GoogleSQL
FROM MyTable@{FORCE_INDEX=MyTableIndex}
PostgreSQL
FROM MyTable /*@ FORCE_INDEX = MyTableIndex */
Você também pode usar uma diretiva de índice para instruir o Spanner a verificar a tabela base em vez de usar um índice:
GoogleSQL
FROM MyTable@{FORCE_INDEX=_BASE_TABLE}
PostgreSQL
FROM MyTable /*@ FORCE_INDEX = _BASE_TABLE */
O exemplo a seguir mostra uma consulta SQL que especifica um índice:
GoogleSQL
SELECT AlbumId, AlbumTitle, MarketingBudget
FROM Albums@{FORCE_INDEX=AlbumsByAlbumTitle}
WHERE AlbumTitle >= "Aardvark" AND AlbumTitle < "Goo";
PostgreSQL
SELECT AlbumId, AlbumTitle, MarketingBudget
FROM Albums /*@ FORCE_INDEX = AlbumsByAlbumTitle */
WHERE AlbumTitle >= 'Aardvark' AND AlbumTitle < 'Goo';
Uma diretiva de índice pode forçar o processador de consultas do Spanner a ler
colunas adicionais que são exigidas pela consulta, mas não armazenadas no índice.
O processador de consultas recupera essas colunas unindo o índice e a tabela base. Para evitar essa junção extra, use uma cláusula STORING
(bancos de dados do dialeto GoogleSQL) ou INCLUDE
(bancos de dados do dialeto PostgreSQL) para armazenar as colunas adicionais no índice.
No exemplo anterior, a coluna MarketingBudget
não é
armazenada no índice, mas a consulta SQL seleciona essa coluna. Como resultado,
o Spanner precisa pesquisar a coluna MarketingBudget
na tabela base e, em seguida, associá-la aos dados do índice para retornar os resultados da consulta.
O Spanner gera um erro se a diretiva de indexação tiver um dos seguintes problemas:
- O índice não existe.
- O índice está em uma tabela base diferente.
- Falta um a expressão de filtragem obrigatória
NULL
para um índiceNULL_FILTERED
.
Os exemplos a seguir mostram como gravar e executar consultas que buscam os valores de AlbumId
, AlbumTitle
e MarketingBudget
usando o índice AlbumsByAlbumTitle
:
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Especificar um índice na interface de leitura
Quando você usa a interface de leitura para o Spanner e quer que ele use um índice, é necessário especificar o índice. A interface de leitura não seleciona o índice automaticamente.
Além disso, seu índice deve conter todos os dados que aparecem nos resultados da consulta, excluindo as colunas que fazem parte da chave primária. Essa restrição existe porque a interface de leitura não é compatível com junções entre o índice e a tabela base. Se você precisar incluir outras colunas nos resultados da consulta, terá algumas opções:
- Use uma cláusula
STORING
ouINCLUDE
para armazenar as colunas adicionais no índice. - Consulte sem incluir as colunas adicionais e use as chaves primárias para enviar outra consulta que lê as colunas adicionais.
O Spanner retorna valores do índice em ordem de classificação crescente por chave de índice. Para recuperar os valores em ordem decrescente, siga estas etapas:
Anote a chave de índice com
DESC
: Por exemplo:CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle DESC);
A anotação
DESC
se aplica a uma única chave de índice. Se o índice incluir mais de uma chave e você desejar que os resultados apareçam em ordem descendente com base em todas as chaves, inclua uma anotaçãoDESC
para cada chave.Se a leitura especificar um intervalo de chaves, certifique-se de que o intervalo de chaves também esteja em ordem decrescente. Em outras palavras, o valor da chave inicial precisa ser maior que o valor da chave final.
O exemplo a seguir mostra como recuperar os valores de AlbumId
e AlbumTitle
usando o índice AlbumsByAlbumTitle
:
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Criar um índice para verificações somente de índice
Opcionalmente, é possível usar a cláusula STORING
(para bancos de dados com dialeto GoogleSQL) ou INCLUDE
(para bancos de dados com dialeto PostgreSQL) para armazenar uma cópia de uma coluna no
índice. Esse tipo de índice oferece vantagens para consultas e chamadas de leitura usando o índice, ao custo de usar armazenamento extra:
- As consultas SQL que usam o índice e selecionam as colunas armazenadas na cláusula
STORING
ouINCLUDE
não exigem uma vinculação extra à tabela base. - As chamadas
read()
que usam o índice podem ler colunas armazenadas pela cláusulaSTORING
/INCLUDE
.
Por exemplo, suponha que você criou uma versão alternativa de AlbumsByAlbumTitle
que armazena uma cópia da coluna MarketingBudget
no índice (observe a
cláusula STORING
ou INCLUDE
em negrito):
GoogleSQL
CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) STORING (MarketingBudget);
PostgreSQL
CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) INCLUDE (MarketingBudget);
Com o antigo índice AlbumsByAlbumTitle
, o Spanner precisa unir o índice
com a tabela base e recuperar a coluna dela. Com o novo
índice AlbumsByAlbumTitle2
, o Spanner lê a coluna diretamente do
índice, que é mais eficiente.
Se você usar a interface de leitura em vez de SQL, o novo índice AlbumsByAlbumTitle2
também permitirá que você leia a coluna MarketingBudget
diretamente:
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Alterar um índice
É possível usar a instrução ALTER INDEX
para adicionar outras colunas
a um índice ou excluir colunas. Isso
pode atualizar a lista de colunas definida pela cláusula STORING
(bancos de dados do dialeto GoogleSQL) ou INCLUDE
(bancos de dados do dialeto PostgreSQL) ao criar o
índice. Não é possível usar essa instrução para adicionar ou excluir colunas da chave de índice. Por exemplo, em vez de criar um novo índice AlbumsByAlbumTitle2
, use ALTER INDEX
para adicionar uma coluna a AlbumsByAlbumTitle
, conforme mostrado no exemplo a seguir:
GoogleSQL
ALTER INDEX AlbumsByAlbumTitle ADD STORED COLUMN MarketingBudget
PostgreSQL
ALTER INDEX AlbumsByAlbumTitle ADD INCLUDE COLUMN MarketingBudget
Quando você adiciona uma nova coluna a um índice existente, o Spanner
usa um processo de preenchimento em segundo plano. Enquanto o preenchimento em andamento estiver em andamento,
a coluna no índice não poderá ser lida. Portanto, talvez você não receba o aumento de desempenho
esperado. É possível usar o comando gcloud spanner operations
para listar a operação de longa duração e conferir o status dela.
Para mais informações, consulte descrever a operação.
Você também pode usar cancel operation para cancelar uma operação em andamento.
Depois que o preenchimento for concluído, o Spanner vai adicionar a coluna ao índice. À medida que o índice cresce, isso pode desacelerar as consultas que usam o índice.
O exemplo a seguir mostra como excluir uma coluna de um índice:
GoogleSQL
ALTER INDEX AlbumsByAlbumTitle DROP STORED COLUMN MarketingBudget
PostgreSQL
ALTER INDEX AlbumsByAlbumTitle DROP INCLUDE COLUMN MarketingBudget
Índice de valores NULL
Por padrão, o Spanner indexa os valores NULL
. Por exemplo, lembre-se da definição do índice SingersByFirstLastName
na tabela Singers
:
CREATE INDEX SingersByFirstLastName ON Singers(FirstName, LastName);
Todas as linhas de Singers
são indexadas mesmo se FirstName
ou LastName
, ou ambas, forem NULL
.
Quando valores NULL
são indexados, é possível realizar consultas SQL eficientes e leituras sobre dados que incluem valores NULL
. Por exemplo, use esta instrução de consulta SQL para encontrar todos Singers
com NULL
FirstName
:
GoogleSQL
SELECT s.SingerId, s.FirstName, s.LastName
FROM Singers@{FORCE_INDEX=SingersByFirstLastName} AS s
WHERE s.FirstName IS NULL;
PostgreSQL
SELECT s.SingerId, s.FirstName, s.LastName
FROM Singers /* @ FORCE_INDEX = SingersByFirstLastName */ AS s
WHERE s.FirstName IS NULL;
Ordem de classificação para valores NULL
O Spanner classifica NULL
como o menor valor para qualquer tipo. Para uma coluna em ordem crescente (ASC
), os valores NULL
são classificados primeiro. Para uma coluna em ordem decrescente (DESC
), os NULL
valores classificam por último.
Desativar a indexação de valores NULL
GoogleSQL
Para desativar a indexação de nulos, adicione a palavra-chave NULL_FILTERED
à definição do índice. Índices NULL_FILTERED
são particularmente úteis para indexar colunas esparsas, onde a maioria das linhas contém um valor NULL
. Nesses casos, o índice NULL_FILTERED
pode ser consideravelmente menor e mais eficiente de manter do que um índice normal que inclua valores NULL
.
Aqui está uma definição alternativa de SingersByFirstLastName
que não indexa os valores NULL
:
CREATE NULL_FILTERED INDEX SingersByFirstLastNameNoNulls
ON Singers(FirstName, LastName);
A palavra-chave NULL_FILTERED
se aplica a todas as colunas de chave de índice. Não é possível especificar a filtragem de NULL
por coluna.
PostgreSQL
Para filtrar linhas com valores nulos em uma ou mais colunas indexadas, use o
predicado WHERE COLUMN IS NOT NULL
.
Índices filtrados por valores nulos são particularmente úteis para indexar colunas esparsas, em que a maioria das linhas contém um valor NULL
. Nesses casos, o índice filtrado por nulos pode ser consideravelmente menor e mais eficiente de manter do que um índice normal que inclua valores NULL
.
Aqui está uma definição alternativa de SingersByFirstLastName
que não indexa os valores NULL
:
CREATE INDEX SingersByFirstLastNameNoNulls
ON Singers(FirstName, LastName)
WHERE FirstName IS NOT NULL
AND LastName IS NOT NULL;
Filtrar os valores NULL
impede que o Spanner os use para algumas
consultas. Por exemplo, o Spanner não usa o índice para esta consulta,
porque o índice omite todas as linhas Singers
para as quais LastName
é NULL
. Como
resultado, usar o índice impediria que a consulta retornasse as linhas corretas:
GoogleSQL
FROM Singers@{FORCE_INDEX=SingersByFirstLastNameNoNulls}
WHERE FirstName = "John";
PostgreSQL
FROM Singers /*@ FORCE_INDEX = SingersByFirstLastNameNoNulls */
WHERE FirstName = 'John';
Para permitir que o Spanner use o índice, você deve regravar a consulta para que ela exclua as linhas que também foram excluídas do índice:
GoogleSQL
SELECT FirstName, LastName
FROM Singers@{FORCE_INDEX=SingersByFirstLastNameNoNulls}
WHERE FirstName = 'John' AND LastName IS NOT NULL;
PostgreSQL
SELECT FirstName, LastName
FROM Singers /*@ FORCE_INDEX = SingersByFirstLastNameNoNulls */
WHERE FirstName = 'John' AND LastName IS NOT NULL;
Campos de proto de índice
Use colunas geradas para indexar
campos em buffers de protocolo armazenados em colunas PROTO
, desde que os campos
indexados usem os tipos de dados primitivos ou ENUM
.
Se você definir um índice em um campo de mensagem de protocolo, não será possível modificar ou remover esse campo do esquema proto. Para mais informações, consulte Atualizações de esquemas que contêm um índice em campos proto.
Confira a seguir um exemplo da tabela Singers
com uma coluna de mensagem proto
SingerInfo
. Para definir um índice no campo nationality
da PROTO
,
crie uma coluna gerada armazenada:
GoogleSQL
CREATE PROTO BUNDLE (googlesql.example.SingerInfo, googlesql.example.SingerInfo.Residence);
CREATE TABLE Singers (
SingerId INT64 NOT NULL,
...
SingerInfo googlesql.example.SingerInfo,
SingerNationality STRING(MAX) AS (SingerInfo.nationality) STORED
) PRIMARY KEY (SingerId);
Ele tem a seguinte definição do tipo proto googlesql.example.SingerInfo
:
GoogleSQL
package googlesql.example;
message SingerInfo {
optional string nationality = 1;
repeated Residence residence = 2;
message Residence {
required int64 start_year = 1;
optional int64 end_year = 2;
optional string city = 3;
optional string country = 4;
}
}
Em seguida, defina um índice no campo nationality
do proto:
GoogleSQL
CREATE INDEX SingersByNationality ON Singers(SingerNationality);
A consulta SQL a seguir lê dados usando o índice anterior:
GoogleSQL
SELECT s.SingerId, s.FirstName
FROM Singers AS s
WHERE s.SingerNationality = "English";
Observações:
- Use uma diretiva de índice para acessar índices nos campos de colunas de buffer de protocolo.
- Não é possível criar um índice em campos de buffer de protocolo repetidos.
Atualizações em esquemas que contêm um índice em campos proto
Se você definir um índice em um campo de mensagem de protocolo, não será possível modificar ou remover esse campo do esquema proto. Isso ocorre porque, depois de definir o índice, a verificação de tipo é realizada sempre que o esquema é atualizado. O Spanner captura as informações de tipo de todos os campos no caminho que são usados na definição do índice.
Índices exclusivos
Os índices podem ser declarados como UNIQUE
. Os índices UNIQUE
adicionam uma restrição aos dados indexados que proíbem entradas duplicadas para uma determinada chave de índice.
Essa restrição é imposta pelo Spanner no momento da confirmação da transação.
Especificamente, qualquer transação que gere várias entradas de índice para a mesma chave falhará na confirmação.
Se uma tabela contiver dados não UNIQUE
para começar, a tentativa de criar um índice UNIQUE
nela falhará.
Uma observação sobre índices UNIQUE NULL_FILTERED
Um índice UNIQUE NULL_FILTERED
não impõe a exclusividade da chave de índice quando pelo menos uma das partes de chave do índice é NULL.
Por exemplo, suponha que você tenha criado a tabela e o índice a seguir:
GoogleSQL
CREATE TABLE ExampleTable (
Key1 INT64 NOT NULL,
Key2 INT64,
Key3 INT64,
Col1 INT64,
) PRIMARY KEY (Key1, Key2, Key3);
CREATE UNIQUE NULL_FILTERED INDEX ExampleIndex ON ExampleTable (Key1, Key2, Col1);
PostgreSQL
CREATE TABLE ExampleTable (
Key1 BIGINT NOT NULL,
Key2 BIGINT,
Key3 BIGINT,
Col1 BIGINT,
PRIMARY KEY (Key1, Key2, Key3)
);
CREATE UNIQUE INDEX ExampleIndex ON ExampleTable (Key1, Key2, Col1)
WHERE Key1 IS NOT NULL
AND Key2 IS NOT NULL
AND Col1 IS NOT NULL;
As duas linhas a seguir em ExampleTable
têm os mesmos valores para as chaves de índice secundário Key1
, Key2
e Col1
:
1, NULL, 1, 1
1, NULL, 2, 1
Como Key2
é NULL
e o índice é filtrado por nulos, as linhas não estarão
presentes no índice ExampleIndex
. Como eles não são inseridos no índice, o índice não os rejeita por violar a exclusividade em (Key1, Key2,
Col1)
.
Se você quiser que o índice imponha a exclusividade dos valores da tupla (Key1
,
Key2
, Col1
), anote Key2
com NOT NULL
na definição da tabela
ou crie o índice sem filtrar valores nulos.
Excluir um índice
Use a instrução DROP INDEX
para descartar um índice secundário do seu esquema.
Para descartar o índice chamado SingersByFirstLastName
:
DROP INDEX SingersByFirstLastName;
Índice para uma verificação mais rápida
Quando o Spanner precisa realizar uma verificação de tabela (em vez de uma pesquisa indexada) para buscar valores de uma ou mais colunas, você pode receber resultados mais rápidos se um índice existir para essas colunas e na ordem especificada pela consulta. Se você executa com frequência consultas que exigem verificações, crie índices secundários para ajudar essas verificações a acontecerem com mais eficiência.
Em particular, se você precisar que o Spanner verifique com frequência a chave primária de uma tabela ou outro índice na ordem inversa, poderá aumentar a eficiência usando um índice secundário que torne a ordem escolhida explícita.
Por exemplo, a consulta a seguir sempre retorna um resultado rápido, mesmo que
o Spanner precise verificar Songs
para encontrar o menor valor de
SongId
:
SELECT SongId FROM Songs LIMIT 1;
SongId
é a chave primária da tabela, armazenada (como todas as chaves primárias)
em ordem crescente. O Spanner pode verificar o índice da chave e encontrar
o primeiro resultado rapidamente.
No entanto, sem a ajuda de um índice secundário, a consulta a seguir não
seria retornada tão rapidamente, especialmente se Songs
tiver muitos dados:
SELECT SongId FROM Songs ORDER BY SongId DESC LIMIT 1;
Embora SongId
seja a chave primária da tabela, o Spanner não tem como buscar o valor mais alto da coluna sem recorrer a uma verificação completa da tabela.
Adicionar o índice a seguir permitiria que essa consulta fosse retornada mais rápido:
CREATE INDEX SongIdDesc On Songs(SongId DESC);
Com esse índice, o Spanner o usaria para retornar um resultado para a segunda consulta muito mais rapidamente.
A seguir
- Saiba mais sobre as práticas recomendadas de SQL para o Spanner.
- Entenda os planos de execução de consulta para o Spanner.
- Saiba como resolver problemas de regressões de desempenho em consultas SQL.