Exclusões
Neste documento, descrevemos como excluir dados armazenados nas tabelas do Bigtable, discutimos quando usar cada abordagem e fornecemos exemplos. Antes de ler esta página, familiarize-se com a visão geral do Bigtable e entenda os conceitos envolvidos no design do esquema.
Para consistência, as descrições nesta página referem-se aos métodos da API usados para cada tipo de solicitação. No entanto, recomendamos que você sempre use uma das bibliotecas de cliente do Bigtable para acessar as APIs do Bigtable, em vez de usar REST ou RPC.
Os exemplos nesta página usam dados de amostra semelhantes aos dados que podem ser armazenados no Bigtable.
Para saber o número de vezes que é possível usar as operações descritas nesta página por dia, consulte Cotas e limites.
Como o Bigtable exclui dados
Quando você envia uma solicitação de exclusão, as células são marcadas para exclusão e não podem ser lidas. Os dados são removidos até uma semana depois, durante a compactação, um processo em segundo plano que otimiza continuamente a tabela. Os metadados de exclusão podem fazer com que os dados ocupem um pouco mais de espaço (vários kb por linha) por alguns dias após o envio de uma solicitação de exclusão, até que ocorra a próxima compactação.
É possível enviar uma solicitação de exclusão mesmo que o cluster tenha excedido o limite de armazenamento e que as leituras e gravações estejam bloqueadas.
Excluir um intervalo de linhas
Se você quiser excluir uma grande quantidade de dados armazenados em linhas contíguas, use dropRowRange
. Essa operação exclui todas as linhas de um intervalo de linhas identificadas por uma linha inicial e final ou um prefixo de chave de linha.
Os valores-chave de linha fornecidos ao excluir um intervalo de linhas são tratados como dados de serviço. Para informações sobre como os dados de serviço são processados, consulte o Aviso de privacidade do Google Cloud.
Depois que uma exclusão é concluída e você recebe uma resposta, é possível gravar dados com segurança no mesmo intervalo de linhas.
A operação dropRowRange
tem as seguintes restrições:
- Não é possível descartar um intervalo de linhas de uma visualização autorizada.
- Não é possível chamar o método
dropRowRange
de forma assíncrona. Se você enviar uma solicitaçãodropRowRange
para uma tabela enquanto outra solicitação estiver em andamento, o Bigtable retornará um erro. Para resolver o erro, envie a solicitação novamente. - Com instâncias que usam replicação, esteja ciente de que o Bigtable pode levar muito tempo para concluir a operação devido ao aumento da latência de replicação e ao uso da CPU. Para excluir dados de uma instância que usa replicação, use a API Data para ler e excluir os dados.
Os exemplos de código a seguir mostram como descartar um intervalo de linhas que começam com
o prefixo de chave de linha phone#5c10102
:
Java
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir dados usando métodos da API Data
Se você precisa excluir pequenas quantidades de dados não contíguos, a melhor opção geralmente é fazer isso usando um método que chama a API Cloud Bigtable (API Data). Use esses métodos se estiver excluindo MB, e não GB, de dados em uma solicitação. Usar a API Data é a única maneira de excluir dados de uma coluna (não do grupo de colunas).
Os métodos da API de dados chamam MutateRows
com um dos três tipos de mutação:
- DeleteFromColumn
- DeleteFromFamily
- DeleteFromRow
Uma solicitação de exclusão que usa a API Data é atômica: ou a solicitação é bem-sucedida e todos os dados são excluídos ou a solicitação falha e nenhum dado é removido.
Na maioria dos casos, evite usar métodos CheckAndMutate
para excluir dados. No caso raro de você precisar de consistência forte, convém usar essa abordagem, mas saiba que ela consome muitos recursos, e o desempenho pode ser afetado.
Para usar MutateRows
para excluir dados, envie uma solicitação readRows
com um filtro para determinar o que você quer excluir e, em seguida, envie a solicitação de exclusão. Para ver uma lista dos filtros disponíveis, consulte Filtros.
As amostras nesta seção pressupõem que você já tenha determinado quais dados excluir.
Excluir de uma coluna
Os exemplos de código a seguir demonstram como excluir todas as células de uma coluna em uma linha:
Java
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir de um grupo de colunas
Os exemplos de código a seguir demonstram como excluir células de um grupo de colunas em uma linha:
Java
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir de uma linha
Os snippets de código abaixo demonstram como excluir todas as células de uma linha:
Java
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir por streaming e em lotes
O streaming e o agrupamento em lote das solicitações de exclusão geralmente são a melhor maneira de excluir grandes quantidades de dados. Essa estratégia pode ser útil quando você tem requisitos de retenção de dados mais refinados do que o permitido pelas políticas de coleta de lixo.
Os snippets de código a seguir iniciam um fluxo de dados (leitura de
linhas), os agrupam, passam pelo lote e excluem todas as
células na coluna data_plan_01gb1
do grupo de colunas cell_plan
:
Java
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Python
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Node.js
Para saber como instalar e usar a biblioteca de cliente para o Bigtable, consulte Bibliotecas de cliente do Bigtable.
Para autenticar no Bigtable, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
Excluir dados em uma visualização autorizada
Para excluir os dados da tabela, envie uma solicitação de exclusão a uma visualização autorizada. Use uma das seguintes opções:
- CLI da gcloud
- Cliente Bigtable para Java
Ao excluir dados de uma visualização autorizada, você fornece o ID da visualização autorizada, além do ID da tabela.
Os dados que você pode excluir de uma visualização autorizada são limitados pela
definição da visualização autorizada. Só é possível excluir dados incluídos na visualização autorizada. Se você tentar excluir dados que estão fora da
definição da visualização autorizada ou que estão sujeitos às regras a seguir, um
erro de PERMISSION_DENIED
é retornado:
- Não é possível excluir um intervalo de linhas de uma visualização autorizada usando
DropRowRange
na API Admin. - Não é possível excluir itens de uma linha.
- É possível excluir de uma coluna desde que seja para linhas que estejam na visualização autorizada.
- A exclusão de um grupo de colunas só será permitida se o grupo especificado
estiver configurado para permitir todos os prefixos do qualificador de coluna (
qualifier_prefixes=""
) na visualização autorizada.
Por exemplo, se você tentar excluir de uma linha especificada e essa linha contiver colunas na tabela subjacente que não estão na visualização autorizada, a solicitação falhará.