Exclusões
Neste documento, descrevemos como excluir dados armazenados nas tabelas do Bigtable, discutimos quando usar cada abordagem e fornecemos exemplos. Antes de ler esta página, familiarize-se com a visão geral do Bigtable e entenda os conceitos envolvidos no design do esquema.
Para consistência, as descrições nesta página referem-se aos métodos da API usados para cada tipo de solicitação. No entanto, é altamente recomendável use uma das opções de cliente do Bigtable bibliotecas para acessar as APIs do Bigtable em vez de usar REST ou RPC.
Os exemplos nesta página usam dados de amostra semelhantes aos dados que podem ser armazenados no Bigtable.
Para saber o número de vezes que é possível usar as operações descritas neste página por dia, consulte Cotas e limites de desempenho.
Como o Bigtable exclui dados
Quando você envia uma solicitação de exclusão, as células são marcadas para exclusão e não podem ser lidas. Os dados são removidos até uma semana depois, durante a compactação, um processo em segundo plano que otimiza continuamente a tabela. Os metadados de exclusão podem fazer com que os dados ocupem um pouco mais de espaço (vários kb por linha) por alguns dias após o envio de uma solicitação de exclusão, até que ocorra a próxima compactação.
É possível enviar uma solicitação de exclusão mesmo que o cluster tenha excedido o limite de armazenamento e que as leituras e gravações estejam bloqueadas.
Excluir um intervalo de linhas
Se você quiser excluir uma grande quantidade de dados armazenados em linhas contíguas, use dropRowRange
. Essa operação exclui todas as linhas de um intervalo de linhas identificadas por uma linha inicial e final ou um prefixo de chave de linha.
Os valores da chave de linha fornecidos ao excluir um intervalo de linhas são tratados como dados de serviço. Para informações sobre como os dados de serviço são processados, consulte o Aviso de privacidade do Google Cloud.
Depois que uma exclusão é concluída e você recebe uma resposta, é possível gravar dados com segurança no mesmo intervalo de linhas.
A operação dropRowRange
tem as seguintes restrições:
- Não é possível soltar um intervalo de linhas de uma visualização autorizada.
- Não é possível chamar o método
dropRowRange
de forma assíncrona. Se você enviar umadropRowRange
para uma tabela enquanto outra solicitação está em andamento, O Bigtable retorna um erroUNAVAILABLE
com a mensagemA DropRowRange operation is already ongoing
. Para resolver o erro, envie a solicitação novamente. - Em instâncias que usam a replicação, o Bigtable pode levar muito tempo para concluir a operação devido ao aumento da latência de replicação e do uso da CPU. Para excluir dados de uma instância que usa replicação, use a API Data para ler e excluir seus dados.
Os exemplos de código a seguir mostram como descartar um intervalo de linhas que começam com
o prefixo da chave de linha phone#5c10102
:
Java
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir dados usando métodos da API Data
Se você precisa excluir pequenas quantidades de dados não contíguos, excluir os dados usando um método que chama a API Cloud Bigtable (API Data) geralmente é a melhor escolha. Use esses métodos se estiver excluindo MB, e não GB, de dados em uma solicitação. Usar a API Data é a única maneira de excluir dados de uma coluna (não do grupo de colunas).
Os métodos da API de dados chamam MutateRows
com um dos três tipos de mutação:
- DeleteFromColumn
- DeleteFromFamily
- DeleteFromRow
Uma solicitação de exclusão que usa a API Data é atômica: ou a solicitação é bem-sucedida e todos os dados são excluídos ou a solicitação falha e nenhum dado é removido.
Na maioria dos casos, evite usar métodos CheckAndMutate
para excluir dados. No caso raro de você precisar de consistência forte, convém usar essa abordagem, mas saiba que ela consome muitos recursos, e o desempenho pode ser afetado.
Para usar MutateRows
na exclusão de dados, envie uma solicitação readRows
com uma
filtro para determinar o que deseja excluir e, em seguida, envia a solicitação de
solicitação. Para ver uma lista dos filtros disponíveis, consulte Filtros.
As amostras nesta seção pressupõem que você já tenha determinado quais dados excluir.
Excluir de uma coluna
Os exemplos de código a seguir demonstram como excluir todas as células de uma coluna em sequência:
Java
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python asyncio
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir de um grupo de colunas
Os exemplos de código a seguir demonstram como excluir células de um grupo de colunas em sequência:
Java
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python asyncio
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir de uma linha
Os snippets de código abaixo demonstram como excluir todas as células de uma linha:
Java
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python asyncio
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para aprender a instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir por streaming e em lotes
O streaming e o agrupamento em lote das solicitações de exclusão geralmente são a melhor maneira de excluir grandes quantidades de dados. Essa estratégia pode ser útil quando você tem requisitos de retenção de dados mais refinados do que o permitido pelas políticas de coleta de lixo.
Os snippets de código a seguir iniciam um fluxo de dados (leitura
linhas), agrupá-las, agrupá-las e excluir todas as
células na coluna data_plan_01gb1
do grupo de colunas cell_plan
:
Java
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python asyncio
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para saber como instalar e usar a biblioteca de cliente do Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir dados em uma visualização autorizada
Para excluir dados de tabelas, envie uma solicitação de exclusão para uma visualização autorizada. Use uma das seguintes opções:
- CLI da gcloud
- Cliente Bigtable para Java
Quando você exclui dados de uma visualização autorizada, fornece o ID da visualização autorizada além do ID da tabela.
Os dados que você pode excluir de uma visualização autorizada são limitados pelo
a definição de visualização autorizada. Só é possível excluir dados incluídos na
visualização autorizada. Se você tentar excluir dados que estão fora da definição de visualização autorizada ou que estão sujeitos às seguintes regras, um erro PERMISSION_DENIED
será retornado:
- Como excluir um intervalo de linhas de uma visualização autorizada usando
DropRowRange
na API Admin não é compatível. - Não é possível excluir de uma linha.
- É possível excluir de uma coluna, contanto que as linhas estejam no visualização autorizada do BigQuery.
- A exclusão de um grupo de colunas só é permitida se o grupo especificado
for configurado para permitir todos os prefixos de qualificadores de coluna (
qualifier_prefixes=""
) na visualização autorizada.
Por exemplo, se você tentar excluir de uma linha especificada, e essa linha contém colunas na tabela subjacente que não estão em seu visualização autorizada, a solicitação falhará.