Eliminaciones
En este documento, se describe cómo borrar datos almacenados en tablas de Bigtable, se analizan cuándo debes usar cada enfoque y se proporcionan ejemplos. Antes de leer esta página, debes familiarizarte con la descripción general de Bigtable y comprender los conceptos involucrados en el diseño de esquemas.
A fin de mantener la coherencia, las descripciones de esta página hacen referencia a los métodos de la API que se usan para cada tipo de solicitud. Sin embargo, te recomendamos que siempre uses una de las bibliotecas cliente de Bigtable para acceder a las API de Bigtable, en lugar de usar REST o RPC.
En los ejemplos de esta página, se usan datos de muestra similares a los datos que puedes almacenar en Bigtable.
Para obtener información sobre la cantidad de veces que puedes usar las operaciones descritas en esta página por día, consulta Cuotas y límites.
Cómo borra los datos Bigtable
Cuando envías una solicitud de eliminación, las celdas se marcan para su eliminación y no se pueden leer. Los datos se quitan hasta una semana después durante la compactación, un proceso en segundo plano que optimiza la tabla de manera continua. Los metadatos de eliminación pueden hacer que tus datos ocupen un poco más de espacio (varios KB por fila) durante algunos días después de enviar una solicitud de eliminación, hasta que se realice la siguiente compactación.
Puedes enviar una solicitud de eliminación en cualquier momento, incluso si tu clúster excedió el límite de almacenamiento y las operaciones de lectura y escritura están bloqueadas.
Cómo borrar un rango de filas
Si deseas borrar una gran cantidad de datos almacenados en filas contiguas, usa dropRowRange
. Esta operación borra todas las filas de un rango de filas identificadas por una fila inicial y final o un prefijo de clave de fila.
Los valores de clave de fila que proporcionas cuando borras un rango de filas se tratan como datos del servicio. Para obtener información sobre cómo se manejan los datos del servicio, consulta el Aviso de Privacidad de Google Cloud.
Después de que se completa una eliminación correcta y recibes una respuesta, puedes escribir datos de forma segura en el mismo rango de filas.
La operación dropRowRange
tiene las siguientes restricciones:
- No puedes descartar un rango de filas desde una vista autorizada.
- No puedes llamar al método
dropRowRange
de forma asíncrona. Si envías una solicituddropRowRange
a una tabla mientras hay otra solicitud en curso, Bigtable muestra un error. Para resolver el error, vuelve a enviar la solicitud. - Con las instancias que usan la replicación, ten en cuenta que Bigtable puede tardar mucho tiempo en completar la operación debido al aumento de la latencia de replicación y al uso de CPU. Si quieres borrar datos de una instancia que usa la replicación, usa la API de datos para leer y borrar tus datos.
En las siguientes muestras de código, se indica cómo descartar un rango de filas que comienzan con el prefijo de clave de fila phone#5c10102
:
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Sincronización de Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Borra datos con los métodos de la API de datos
Si necesitas borrar pequeñas cantidades de datos no contiguos, borrar los datos con un método que llame a la API de Cloud Bigtable (API de Data) suele ser la mejor opción. Usa estos métodos si deseas borrar MB, no GB, de datos en una solicitud. El uso de la API de datos es la única forma de borrar datos de una columna (no de la familia de columnas).
Los métodos de la API de datos llaman a MutateRows
con uno de los tres tipos de mutación:
- DeleteFromColumn
- DeleteFromFamily
- DeleteFromRow
Una solicitud de eliminación que usa la API de datos es atómica: se realiza correctamente y se borran todos los datos, o bien falla y no se quitan datos.
En la mayoría de los casos, evita usar métodos CheckAndMutate
para borrar datos. En el caso poco frecuente de que necesites una coherencia sólida, te recomendamos usar este enfoque, pero ten en cuenta que requiere muchos recursos y que el rendimiento puede verse afectado.
Si quieres usar MutateRows
para borrar datos, debes enviar una solicitud readRows
con un filtro a fin de determinar lo que deseas borrar y, luego, enviar la solicitud de eliminación. Para obtener una lista de los filtros disponibles, consulta Filtros.
En las muestras de esta sección, se supone que ya determinaste qué datos borrar.
Borrar de una columna
En las siguientes muestras de código, se indica cómo borrar todas las celdas de una columna en una fila:
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Sincronización de Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Borrar de una familia de columnas
En las siguientes muestras de código, se indica cómo borrar celdas de una familia de columnas en una fila:
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Sincronización de Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Borrar de una fila
En los siguientes fragmentos de código, se muestra cómo borrar todas las celdas de una fila:
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Sincronización de Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Borra por transmisión y procesamiento por lotes
La mejor manera de borrar grandes cantidades de datos suele ser transmitir y agrupar en lotes tus solicitudes de eliminación. Esta estrategia puede ser útil cuando tienes requisitos de retención de datos más detallados que los que permiten las políticas de recolección de elementos no utilizados.
Los siguientes fragmentos de código inician una transmisión de datos (filas de lectura), los agrupan por lotes y, luego, pasan por el lote y borran todas las celdas de la columna data_plan_01gb1
en la familia de columnas cell_plan
:
Java
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Sincronización de Python
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Node.js
Para obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta Bibliotecas cliente de Bigtable.
Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Borra datos en una vista autorizada
Para borrar datos de tablas, puedes enviar una solicitud de eliminación a una vista autorizada. Debes usar una de las siguientes opciones:
- gcloud CLI
- Cliente de Bigtable para Java
Cuando borras datos de una vista autorizada, proporcionas el ID de la vista autorizada, además del ID de la tabla.
Los datos que puedes borrar de una vista autorizada están limitados por la definición de vista autorizada. Solo puedes borrar datos que se incluyen en la vista autorizada. Si intentas borrar datos que están fuera de la definición de vista autorizada o que están sujetos a las siguientes reglas, se mostrará un error PERMISSION_DENIED
:
- No se admite la eliminación de un rango de filas de una vista autorizada con
DropRowRange
en la API de Admin. - No se pueden borrar datos de una fila.
- Se admite la eliminación de una columna, siempre y cuando sea para las filas que están en la vista autorizada.
- Solo se pueden borrar datos de una familia de columnas si la familia de columnas especificada está configurada para permitir todos los prefijos del calificador de columna (
qualifier_prefixes=""
) en la vista autorizada.
Por ejemplo, si intentas borrar una fila especificada y esa fila contiene columnas de la tabla subyacente que no están en tu vista autorizada, la solicitud falla.
¿Qué sigue?
- Si usas la biblioteca cliente de HBase, revisa la lista de eliminaciones no admitidas.
- Explora las formas en que puedes supervisar tus recursos de Bigtable.