Objetivos
Este tutorial orienta você nas seguintes etapas usando a biblioteca de cliente do Spanner para Python:
- Crie uma instância e um banco de dados do Spanner.
- Gravar, ler e executar consultas SQL em dados contidos no banco de dados.
- Atualizar o esquema do banco de dados.
- Atualizar dados usando uma transação de leitura e gravação.
- Adicionar um índice secundário ao banco de dados.
- Usar o índice para ler e executar consultas SQL nos dados.
- Recuperar dados usando uma transação somente leitura.
Custos
Neste tutorial, usamos o Spanner, que é um componente faturável da Google Cloud. Para informações sobre o custo de uso do Spanner, consulte Preços.
Antes de começar
Conclua as etapas descritas em Configurar, que abrangem a criação e a configuração de um projeto padrão do Google Cloud, o faturamento, a API Cloud Spanner e a configuração do OAuth 2.0 para receber credenciais de autenticação para usar a API Cloud Spanner.
Especificamente, execute gcloud auth
application-default login
para configurar o ambiente de desenvolvimento local com credenciais de autenticação.
Preparar o ambiente local do Python
Siga as instruções em Como configurar o ambiente de desenvolvimento do Python.
Clone o repositório do app de amostra na máquina local:
git clone https://github.com/googleapis/python-spanner
Outra opção é fazer o download da amostra como um arquivo zip e extraí-lo.
Mude para o diretório que contém o código de exemplo do Spanner:
cd python-spanner/samples/samples
Crie um ambiente Python isolado e instale as dependências:
virtualenv env source env/bin/activate pip install -r requirements.txt
Criar uma instância
Quando você usa o Spanner pela primeira vez, precisa criar uma instância, que é um alocação de recursos usados pelos bancos de dados do Spanner. Ao criar uma instância, escolha uma configuração que determine onde os dados serão armazenados e também o número de nós a serem usados. Isso determina a quantidade de recursos de exibição e armazenamento na instância.
Execute o seguinte comando para criar uma instância do Spanner na região
us-central1
com 1 nó:
gcloud spanner instances create test-instance --config=regional-us-central1 \
--description="Test Instance" --nodes=1
A instância criada tem as seguintes características:
- Código da instância:
test-instance
- Nome de exibição:
Test Instance
- Configuração da instância:
regional-us-central1
as configurações regionais armazenam dados em uma região, enquanto as configurações multirregionais distribuem dados em várias regiões. Para mais informações, consulte Sobre instâncias. - Um nó
node_count
corresponde à quantidade de recursos de exibição e armazenamento disponíveis aos bancos de dados na instância. Saiba mais em Nós e unidades de processamento.
Você verá:
Creating instance...done.
Consultar os arquivos de amostra
O repositório de amostras contém uma amostra que mostra como usar o Spanner com Python.
Confira o arquivosnippets.py
, que mostra como usar o Spanner. O código mostra como criar e usar um novo banco de dados. Os dados usam o esquema de exemplo exibido na página Esquema e modelo de dados.
Criar um banco de dados
Crie um banco de dados chamado example-db
na instância denominada test-instance
executando o seguinte na linha de comando.
python snippets.py test-instance --database-id example-db create_database
Você verá:
Created database example-db on instance test-instance
O próximo passo é gravar dados no seu banco de dados.
Criar um cliente de banco de dados
Antes de fazer leituras ou gravações, você deve criar umClient
. Pense em um Client
como uma conexão com o banco de dados: todas as suas interações com o Spanner precisam passar por um Client
. Normalmente, você cria um Client
quando seu aplicativo é iniciado, e depois reutiliza esse Client
para ler, gravar e executar transações. O código a seguir mostra como criar um cliente.
Leia mais na referência de Client
.
Gravar dados com DML
É possível inserir dados usando a linguagem de manipulação de dados (DML, na sigla em inglês) em uma transação de leitura/gravação.
Use o método execute_update()
para executar uma instrução DML.
Execute a amostra usando o argumento insert_with_dml
.
python snippets.py test-instance --database-id example-db insert_with_dml
Você verá:
4 record(s) inserted.
Gravar dados com mutações
Também é possível inserir dados usando mutações.
Grave dados usando um objeto Batch
. Um objeto Batch
é um contêiner para operações de mutação. Uma mutação
representa uma sequência de inserções, atualizações e exclusões que o Spanner
são aplicados atomicamente em diferentes linhas e tabelas em um banco de dados do Spanner.
O método insert()
na classe Batch
adiciona uma ou mais mutações de inserção ao lote. Todas as mutações em um único lote são aplicadas atomicamente.
Este código mostra como gravar dados usando mutações:
Execute a amostra usando o argumento insert_data
.
python snippets.py test-instance --database-id example-db insert_data
Você verá:
Inserted data.
Consultar dados usando SQL
O Spanner oferece suporte a uma interface SQL para leitura de dados, que pode ser acessada na linha de comando usando a CLI do Google Cloud ou programaticamente usando a biblioteca de cliente do Spanner para Python.
Na linha de comando
Execute a instrução SQL a seguir para ler os valores de todas as colunas da tabela Albums
:
gcloud spanner databases execute-sql example-db --instance=test-instance \
--sql='SELECT SingerId, AlbumId, AlbumTitle FROM Albums'
O resultado será:
SingerId AlbumId AlbumTitle
1 1 Total Junk
1 2 Go, Go, Go
2 1 Green
2 2 Forever Hold Your Peace
2 3 Terrified
Usar a biblioteca de cliente do Spanner para Python
Além de executar uma instrução SQL na linha de comando, você pode emitir a mesma instrução SQL de maneira programática usando a biblioteca de cliente do Spanner para Python.
Use o método execute_sql()
de um objeto Snapshot
para executar a consulta SQL. Para conseguir um objeto Snapshot
, chame o método snapshot()
da classe Database
em uma declaração with
.
Veja como emitir a consulta e acessar os dados:
Execute a amostra usando o argumento query_data
.
python snippets.py test-instance --database-id example-db query_data
Você verá o resultado a seguir:
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
Consulta usando um parâmetro SQL
Se seu aplicativo tiver uma consulta executada com frequência, você poderá melhorar seu desempenho ao parametrizar-o. A consulta paramétrica resultante pode ser armazenada em cache e reutilizada, o que reduz os custos de compilação. Para mais informações, consulte Usar parâmetros de consulta para agilizar as consultas mais executadas.
Este é um exemplo de como usar um parâmetro na cláusula WHERE
para
registros de consulta que contêm um valor específico para LastName
.
Execute a amostra usando o argumento query_data_with_parameter.
python snippets.py test-instance --database-id example-db query_data_with_parameter
Você verá o resultado a seguir:
SingerId: 12, FirstName: Melissa, LastName: Garcia
Ler dados usando a API de leitura
Além da interface SQL, o Spanner também é compatível com uma interface de leitura.
Use o método read()
de um objeto Snapshot
para ler linhas do banco de dados.
Para conseguir um objeto Snapshot
, chame o método snapshot()
da classe Database
em uma declaração with
.
Use um objeto KeySet
para definir uma coleção de chaves e intervalos de chaves para leitura.
Veja como ler os dados:
Execute a amostra usando o argumento read_data
.
python snippets.py test-instance --database-id example-db read_data
Você verá uma saída como:
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
Atualizar o esquema do banco de dados
Suponha que você precise adicionar uma nova coluna denominada MarketingBudget
à tabela Albums
. Para isso, é necessário atualizar seu esquema de banco de dados. O Spanner dá suporte a atualizações de esquema em um banco de dados, enquanto
continua a disponibilizar o tráfego. As atualizações de esquema não exigem
banco de dados off-line e não bloqueiam tabelas ou colunas inteiras. você pode continuar
gravação de dados no banco de dados durante a atualização do esquema. Leia mais sobre os recursos
e o desempenho das alterações de esquema
Faça atualizações de esquema.
Adicionar uma coluna
É possível adicionar uma coluna na linha de comando usando a Google Cloud CLI ou programaticamente usando biblioteca de cliente do Spanner para Python.
Na linha de comando
Use o seguinte comando ALTER TABLE
para adicionar a nova coluna à tabela:
GoogleSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='ALTER TABLE Albums ADD COLUMN MarketingBudget INT64'
PostgreSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='ALTER TABLE Albums ADD COLUMN MarketingBudget BIGINT'
Você verá:
Schema updating...done.
Usar a biblioteca de cliente do Spanner para Python
Usar oupdate_ddl()
da classe Database
para modificar o esquema:
Execute a amostra usando o argumento add_column
.
python snippets.py test-instance --database-id example-db add_column
Você verá:
Added the MarketingBudget column.
Gravar dados na nova coluna
O código a seguir grava dados na coluna nova. Ele define MarketingBudget
como 100000
para a linha indexada por Albums(1, 1)
e como 500000
para a linha indexada por Albums(2, 2)
.
Execute a amostra usando o argumento update_data
.
python snippets.py test-instance --database-id example-db update_data
Também é possível executar uma consulta SQL ou uma chamada de leitura para coletar os valores que você acabou de gravar.
Veja a seguir o código para executar a consulta:
Para executar essa consulta, execute a amostra usando o argumento query_data_with_new_column
.
python snippets.py test-instance --database-id example-db query_data_with_new_column
Você verá:
SingerId: 2, AlbumId: 2, MarketingBudget: 500000
SingerId: 1, AlbumId: 2, MarketingBudget: None
SingerId: 2, AlbumId: 1, MarketingBudget: None
SingerId: 2, AlbumId: 3, MarketingBudget: None
SingerId: 1, AlbumId: 1, MarketingBudget: 100000
Atualizar dados
É possível atualizar dados usando DML em uma transação de leitura/gravação.
Use o método execute_update()
para executar uma instrução DML.
Execute a amostra usando o argumento write_with_dml_transaction
.
python snippets.py test-instance --database-id example-db write_with_dml_transaction
Você verá:
Transferred 200000 from Album2's budget to Album1's
Usar um índice secundário
Suponha que você queira buscar todas as linhas de Albums
que tenham valores AlbumTitle
em um determinado intervalo. É possível ler todos os valores da coluna AlbumTitle
usando uma instrução SQL ou uma chamada de leitura e descartar as linhas que não satisfazem os critérios, mas fazer essa verificação na tabela inteira é caro, especialmente para tabelas com muitas linhas. Em vez disso, acelere a recuperação de linhas ao pesquisar por colunas de chaves não primárias por meio da criação de um índice secundário na tabela.
Adicionar um índice secundário a uma tabela requer uma atualização de esquema. Marcar como "Gostei" outras atualizações de esquema, o Spanner oferece suporte à adição de um índice enquanto o banco de dados continua a disponibilizar o tráfego. O Spanner preenche automaticamente o índice com seus dados atuais. Os preenchimentos podem levar alguns minutos para serem concluídos, mas você não precisa ficar off-line ou evitar gravar na tabela indexada durante esse processo. Para mais detalhes, consulte Adicione um índice secundário.
Depois que você adiciona um índice secundário, o Spanner o usa automaticamente para consultas SQL que provavelmente serão executadas mais rapidamente com o índice. Se você usar a interface de leitura, deverá especificar o índice que quer usar.
Adicionar um índice secundário
É possível adicionar um índice na linha de comando usando a CLI gcloud ou programaticamente, usando a biblioteca de cliente do Spanner para Python.
Na linha de comando
Use o comando CREATE INDEX
a seguir para adicionar um índice ao banco de dados:
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle ON Albums(AlbumTitle)'
Você verá:
Schema updating...done.
Como usar a biblioteca de cliente do Spanner para Python
Use o métodoupdate_ddl()
da classe Database
para adicionar um índice:
Execute a amostra usando o argumento add_index
.
python snippets.py test-instance --database-id example-db add_index
A adição do índice pode levar alguns minutos. Depois da adição, você verá:
Added the AlbumsByAlbumTitle index.
Ler usando o índice
Para consultas SQL, o Spanner usa automaticamente um índice apropriado. Na interface de leitura, especifique o índice em sua solicitação.
Para usar o índice na interface de leitura, forneça um argumento Index
para o método read()
de um objeto Snapshot
. Para conseguir um objeto Snapshot
, chame o método snapshot()
da classe Database
em uma declaração with
.
Execute a amostra usando o argumento read_data_with_index
.
python snippets.py test-instance --database-id example-db read_data_with_index
Você verá:
AlbumId: 2, AlbumTitle: Forever Hold Your Peace
AlbumId: 2, AlbumTitle: Go, Go, Go
AlbumId: 1, AlbumTitle: Green
AlbumId: 3, AlbumTitle: Terrified
AlbumId: 1, AlbumTitle: Total Junk
Adicionar um índice para leituras somente de índice
Talvez você tenha notado que o exemplo de leitura anterior não inclui a leitura da coluna MarketingBudget
. Isso ocorre porque a interface de leitura do Spanner
não oferece suporte à capacidade de mesclar um índice com uma tabela de dados para procurar valores
que não estão armazenados no índice.
Crie uma definição alternativa de AlbumsByAlbumTitle
que armazene uma cópia de MarketingBudget
no índice.
Na linha de comando
GoogleSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) STORING (MarketingBudget)
PostgreSQL
gcloud spanner databases ddl update example-db --instance=test-instance \
--ddl='CREATE INDEX AlbumsByAlbumTitle2 ON Albums(AlbumTitle) INCLUDE (MarketingBudget)
A adição do índice pode levar alguns minutos. Depois da adição, você verá:
Schema updating...done.
Como usar a biblioteca de cliente do Spanner para Python
Use o métodoupdate_ddl()
da classe Database
para adicionar um índice com uma cláusula STORING
:
Execute a amostra usando o argumento add_storing_index
.
python snippets.py test-instance --database-id example-db add_storing_index
Você verá:
Added the AlbumsByAlbumTitle2 index.
Agora é possível executar uma leitura que busque todas as colunas AlbumId
, AlbumTitle
e MarketingBudget
do índice AlbumsByAlbumTitle2
:
Execute a amostra usando o argumento read_data_with_storing_index
.
python snippets.py test-instance --database-id example-db read_data_with_storing_index
Você verá uma saída como:
AlbumId: 2, AlbumTitle: Forever Hold Your Peace, MarketingBudget: 300000
AlbumId: 2, AlbumTitle: Go, Go, Go, MarketingBudget: None
AlbumId: 1, AlbumTitle: Green, MarketingBudget: None
AlbumId: 3, AlbumTitle: Terrified, MarketingBudget: None
AlbumId: 1, AlbumTitle: Total Junk, MarketingBudget: 300000
Recuperar dados usando transações somente leitura
Suponha que você queira executar mais de uma leitura no mesmo carimbo de data/hora. As transações somente leitura observam um prefixo consistente do histórico de confirmações da transação. Portanto, o aplicativo sempre recebe dados consistentes.
Use um objeto Snapshot
para executar transações somente leitura. Para conseguir um objeto Snapshot
, chame o método snapshot()
da classe Database
em uma declaração with
.
Veja a seguir como executar uma consulta e fazer uma leitura na mesma transação somente leitura.
Execute a amostra usando o argumento read_only_transaction
.
python snippets.py test-instance --database-id example-db read_only_transaction
Você verá uma saída como:
Results from first read:
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
Results from second read:
SingerId: 1, AlbumId: 1, AlbumTitle: Total Junk
SingerId: 1, AlbumId: 2, AlbumTitle: Go, Go, Go
SingerId: 2, AlbumId: 1, AlbumTitle: Green
SingerId: 2, AlbumId: 2, AlbumTitle: Forever Hold Your Peace
SingerId: 2, AlbumId: 3, AlbumTitle: Terrified
Limpeza
Para não gerar cobranças extras na sua conta do Google Cloud pelos recursos usados neste tutorial, suspenda o banco de dados e exclua a instância que você criou.
Excluir o banco de dados
Se você excluir uma instância, todos os bancos de dados nela serão excluídos automaticamente. Nesta etapa, mostramos como excluir um banco de dados sem remover a instância. Ainda pode haver cobrança em relação à instância.
Na linha de comando
gcloud spanner databases delete example-db --instance=test-instance
Use o console do Google Cloud
Acesse a página Instâncias do Spanner no console do Google Cloud.
Clique na instância.
Clique no banco de dados que você quer excluir.
Na página Detalhes do banco de dados, clique em Excluir.
Confirme se quer excluir o banco de dados e clique em Excluir.
Excluir a instância
A exclusão de uma instância descarta automaticamente todos os bancos de dados criados nela.
Na linha de comando
gcloud spanner instances delete test-instance
Use o console do Google Cloud
Acesse a página Instâncias do Spanner no console do Google Cloud.
Clique na sua instância.
Clique em Excluir.
Confirme se quer excluir a instância e clique em Excluir.
A seguir
Saiba como acessar o Spanner com uma instância de máquina virtual.
Saiba mais sobre credenciais de autorização e autenticação em Autenticar os serviços do Cloud usando bibliotecas de cliente.
Saiba mais sobre as práticas recomendadas de criação de esquemas do Spanner.