Eliminaciones

En este documento, se describe cómo borrar datos almacenados en tablas de Bigtable, se analiza cuándo debes usar cada enfoque y se proporcionan ejemplos. Antes de leer esta página, debes familiarizarte con la descripción general de Bigtable y comprender los conceptos involucrados en el diseño de esquemas.

Para garantizar la coherencia, las descripciones de esta página hacen referencia a los métodos de la API que se usan para cada tipo de solicitud. Sin embargo, te recomendamos que siempre use una de las bibliotecas cliente de Bigtable para acceder a las APIs de Bigtable en lugar de usar REST o RPC.

En los ejemplos de esta página, se usan datos de muestra similares a los que podrías almacenar en Bigtable.

Para conocer la cantidad de veces que puedes usar las operaciones que se describen en esta página por día, consulta Cuotas y límites.

Cómo borra datos Bigtable

Cuando envías una solicitud de eliminación, las celdas se marcan para su eliminación y no se pueden leer. Los datos se quitan hasta una semana después durante la compactación, un proceso en segundo plano que optimiza la tabla de forma continua. Los metadatos de eliminación pueden hacer que tus datos ocupen un poco más de espacio (varios KB por fila) durante unos días después de que envíes una solicitud de eliminación, hasta que se realice la próxima compactación.

Puedes enviar una solicitud de eliminación en cualquier momento, incluso si tu clúster superó el límite de almacenamiento y se bloquearon las operaciones de lectura y escritura.

Cómo borrar un rango de filas

Si deseas borrar una gran cantidad de datos almacenados en filas contiguas, usa dropRowRange. Esta operación borra todas las filas de un rango de filas identificado por una fila inicial y final, o un prefijo de clave de fila.

Los valores de clave de fila que proporcionas cuando borras un rango de filas se consideran datos del servicio. Para obtener información sobre cómo se manejan los datos de servicio, consulta el Aviso de Privacidad deGoogle Cloud .

Una vez que se complete la eliminación correctamente y recibas una respuesta, podrás escribir datos de forma segura en el mismo rango de filas.

La operación dropRowRange tiene las siguientes restricciones:

  • No puedes descartar un rango de filas de una vista autorizada.
  • No puedes llamar al método dropRowRange de forma asíncrona. Si envías una solicitud dropRowRange a una tabla mientras otra solicitud está en curso, Bigtable muestra un error UNAVAILABLE con el mensaje A DropRowRange operation is already ongoing. Para resolver el error, vuelve a enviar la solicitud.
  • En el caso de las instancias que usan la replicación, ten en cuenta que Bigtable podría tardar mucho tiempo en completar la operación debido al aumento de la latencia de replicación y el uso de CPU. Para borrar datos de una instancia que usa la replicación, usa la API de datos para leer y, luego, borrar tus datos.

En las siguientes muestras de código, se muestra cómo eliminar un rango de filas que comienza con el prefijo de clave de fila phone#5c10102:

Java

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

import com.google.cloud.bigtable.admin.v2.BigtableTableAdminClient;
import java.io.IOException;

public class DropRowRangeExample {
  public void dropRowRange(String projectId, String instanceId, String tableId) throws IOException {
    try (BigtableTableAdminClient tableAdminClient =
        BigtableTableAdminClient.create(projectId, instanceId)) {
      tableAdminClient.dropRowRange(tableId, "phone#4c410523");
    }
  }
}

Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

def drop_row_range(project_id, instance_id, table_id):
    from google.cloud.bigtable import Client

    client = Client(project=project_id, admin=True)
    instance = client.instance(instance_id)
    table = instance.table(table_id)
    row_key_prefix = "phone#4c410523"
    table.drop_by_prefix(row_key_prefix, timeout=200)

Node.js

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

await table.deleteRows('phone#5c10102');
await printRows();

Borra datos con métodos de la API de datos

Si necesitas borrar pequeñas cantidades de datos no contiguos, a menudo, la mejor opción es borrarlos con un método que llame a la API de Cloud Bigtable (API de datos). Usa estos métodos si borras MB, no GB, de datos en una solicitud. Usar la API de datos es la única forma de borrar datos de una columna (no de la familia de columnas).

Los métodos de la API de datos llaman a MutateRows con uno de los tres tipos de mutación:

  • DeleteFromColumn
  • DeleteFromFamily
  • DeleteFromRow

Una solicitud de eliminación con la API de datos es atómica: o se realiza correctamente y se borran todos los datos, o falla y no se quita ningún dato.

En la mayoría de los casos, evita usar métodos CheckAndMutate para borrar datos. En el caso poco frecuente de que necesites una coherencia sólida, te recomendamos que uses este enfoque, pero ten en cuenta que requiere muchos recursos y que el rendimiento podría verse afectado.

Para usar MutateRows y borrar datos, envía una solicitud readRows con un filtro para determinar lo que deseas borrar y, luego, envía la solicitud de eliminación. Para obtener una lista de los filtros disponibles, consulta Filtros.

En los ejemplos de esta sección, se da por sentado que ya determinaste qué datos borrar.

Borrar de una columna

En las siguientes muestras de código, se muestra cómo borrar todas las celdas de una columna en una fila:

Java

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

import com.google.cloud.bigtable.data.v2.BigtableDataClient;
import com.google.cloud.bigtable.data.v2.models.Mutation;
import com.google.cloud.bigtable.data.v2.models.RowMutation;
import com.google.cloud.bigtable.data.v2.models.TableId;
import java.io.IOException;

public class DeleteFromColumnExample {
  public void deleteFromColumnCells(String projectId, String instanceId, String tableId)
      throws IOException {
    try (BigtableDataClient dataClient = BigtableDataClient.create(projectId, instanceId)) {
      Mutation mutation = Mutation.create().deleteCells("cell_plan", "data_plan_01gb");
      dataClient.mutateRow(
          RowMutation.create(TableId.of(tableId), "phone#4c410523#20190501", mutation));
    }
  }
}

Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

def delete_from_column(project_id, instance_id, table_id):
    from google.cloud.bigtable import Client

    client = Client(project=project_id, admin=True)
    instance = client.instance(instance_id)
    table = instance.table(table_id)
    row = table.row("phone#4c410523#20190501")
    row.delete_cell(column_family_id="cell_plan", column="data_plan_01gb")
    row.commit()

asyncio de Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

async def delete_from_column(project_id, instance_id, table_id):
    from google.cloud.bigtable.data import BigtableDataClientAsync
    from google.cloud.bigtable.data import DeleteRangeFromColumn

    client = BigtableDataClientAsync(project=project_id)
    table = client.get_table(instance_id, table_id)

    await table.mutate_row(
        "phone#4c410523#20190501",
        DeleteRangeFromColumn(family="cell_plan", qualifier=b"data_plan_01gb"),
    )

    await table.close()
    await client.close()

Node.js

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

await table.mutate({
  key: 'phone#4c410523#20190501',
  method: 'delete',
  data: {
    column: 'cell_plan:data_plan_05gb',
  },
});
await printRows();

Cómo borrar elementos de una familia de columnas

En las siguientes muestras de código, se muestra cómo borrar celdas de una familia de columnas en una fila:

Java

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

import com.google.cloud.bigtable.data.v2.BigtableDataClient;
import com.google.cloud.bigtable.data.v2.models.RowMutation;
import com.google.cloud.bigtable.data.v2.models.TableId;
import java.io.IOException;

public class DeleteFromColumnFamilyExample {
  public void deleteFromColumnFamily(String projectId, String instanceId, String tableId)
      throws IOException {
    try (BigtableDataClient dataClient = BigtableDataClient.create(projectId, instanceId)) {
      dataClient.mutateRow(
          RowMutation.create(TableId.of(tableId), "phone#5c10102#20190501")
              .deleteFamily("stats_summary"));
    }
  }
}

Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

def delete_from_column_family(project_id, instance_id, table_id):
    from google.cloud.bigtable import Client

    client = Client(project=project_id, admin=True)
    instance = client.instance(instance_id)
    table = instance.table(table_id)
    row = table.row("phone#4c410523#20190501")
    row.delete_cells(column_family_id="cell_plan", columns=row.ALL_COLUMNS)
    row.commit()

asyncio de Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

async def delete_from_column_family(project_id, instance_id, table_id):
    from google.cloud.bigtable.data import BigtableDataClientAsync
    from google.cloud.bigtable.data import DeleteAllFromFamily

    client = BigtableDataClientAsync(project=project_id)
    table = client.get_table(instance_id, table_id)

    await table.mutate_row("phone#4c410523#20190501", DeleteAllFromFamily("cell_plan"))

    await table.close()
    await client.close()

Node.js

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

await table.mutate({
  key: 'phone#4c410523#20190501',
  method: 'delete',
  data: {
    column: 'cell_plan',
  },
});
await printRows();

Cómo borrar de una fila

En los siguientes fragmentos de código, se muestra cómo borrar todas las celdas de una fila:

Java

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

import com.google.cloud.bigtable.data.v2.BigtableDataClient;
import com.google.cloud.bigtable.data.v2.models.Mutation;
import com.google.cloud.bigtable.data.v2.models.RowMutation;
import com.google.cloud.bigtable.data.v2.models.TableId;
import java.io.IOException;

public class DeleteFromRowExample {
  public void deleteFromRow(String projectId, String instanceId, String tableId)
      throws IOException {
    try (BigtableDataClient dataClient = BigtableDataClient.create(projectId, instanceId)) {
      Mutation mutation = Mutation.create().deleteRow();
      dataClient.mutateRow(
          RowMutation.create(TableId.of(tableId), "phone#4c410523#20190501", mutation));
    }
  }
}

Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

def delete_from_row(project_id, instance_id, table_id):
    from google.cloud.bigtable import Client

    client = Client(project=project_id, admin=True)
    instance = client.instance(instance_id)
    table = instance.table(table_id)
    row = table.row("phone#4c410523#20190501")
    row.delete()
    row.commit()

asyncio de Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

async def delete_from_row(project_id, instance_id, table_id):
    from google.cloud.bigtable.data import BigtableDataClientAsync
    from google.cloud.bigtable.data import DeleteAllFromRow

    client = BigtableDataClientAsync(project=project_id)
    table = client.get_table(instance_id, table_id)

    await table.mutate_row("phone#4c410523#20190501", DeleteAllFromRow())

    await table.close()
    await client.close()

Node.js

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

const row = table.row('phone#4c410523#20190501');
await row.delete();
await printRows();

Borra por transmisión y por lotes

A menudo, la transmisión y el procesamiento por lotes de tus solicitudes de eliminación son la mejor manera de borrar gran cantidad de datos. Esta estrategia puede ser útil cuando tienes requisitos de retención de datos más detallados que los que permiten las políticas de recolección de basura.

Si tu aplicación está escrita en Java, puedes habilitar el control de flujo de escritura en lotes cuando envíes eliminaciones masivas a Bigtable. Para obtener más información, consulta Control de flujo de operaciones de escritura por lotes. Para ver cómo habilitarlo, consulta Habilita el control de flujo de escritura por lotes.

Los siguientes fragmentos de código inician un flujo de datos (lee filas), los agrupan y, luego, revisan el lote y borran todas las celdas de la columna data_plan_01gb1 en la familia de columnas cell_plan:

Java

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

import com.google.api.gax.batching.Batcher;
import com.google.api.gax.rpc.ServerStream;
import com.google.cloud.bigtable.data.v2.BigtableDataClient;
import com.google.cloud.bigtable.data.v2.models.Query;
import com.google.cloud.bigtable.data.v2.models.Row;
import com.google.cloud.bigtable.data.v2.models.RowMutationEntry;
import com.google.cloud.bigtable.data.v2.models.TableId;
import java.io.IOException;

public class BatchDeleteExample {
  public void batchDelete(String projectId, String instanceId, String tableId)
      throws InterruptedException, IOException {
    try (BigtableDataClient dataClient = BigtableDataClient.create(projectId, instanceId)) {
      try (Batcher<RowMutationEntry, Void> batcher =
          dataClient.newBulkMutationBatcher(TableId.of(tableId))) {
        ServerStream<Row> rows = dataClient.readRows(Query.create(TableId.of(tableId)));
        for (Row row : rows) {
          batcher.add(
              RowMutationEntry.create(row.getKey()).deleteCells("cell_plan", "data_plan_05gb"));
        }
        // Blocks until mutations are applied on all submitted row entries.
        batcher.flush();
      }
    }
  }
}

Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

def streaming_and_batching(project_id, instance_id, table_id):
    from google.cloud.bigtable import Client

    client = Client(project=project_id, admin=True)
    instance = client.instance(instance_id)
    table = instance.table(table_id)
    batcher = table.mutations_batcher(flush_count=2)
    rows = table.read_rows()
    for row in rows:
        row = table.row(row.row_key)
        row.delete_cell(column_family_id="cell_plan", column="data_plan_01gb")

    batcher.mutate_rows(rows)

asyncio de Python

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

async def streaming_and_batching(project_id, instance_id, table_id):
    from google.cloud.bigtable.data import BigtableDataClientAsync
    from google.cloud.bigtable.data import DeleteRangeFromColumn
    from google.cloud.bigtable.data import RowMutationEntry
    from google.cloud.bigtable.data import ReadRowsQuery

    client = BigtableDataClientAsync(project=project_id)
    table = client.get_table(instance_id, table_id)

    async with table.mutations_batcher() as batcher:
        async for row in await table.read_rows_stream(ReadRowsQuery(limit=10)):
            await batcher.append(
                RowMutationEntry(
                    row.row_key,
                    DeleteRangeFromColumn(
                        family="cell_plan", qualifier=b"data_plan_01gb"
                    ),
                )
            )

    await table.close()
    await client.close()

Node.js

Si deseas obtener información sobre cómo instalar y usar la biblioteca cliente de Bigtable, consulta las bibliotecas cliente de Bigtable.

Para autenticarte en Bigtable, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.

const rows = (await table.getRows({limit: 2}))[0];
const entries = rows.map(row => {
  return {
    key: row.id,
    method: 'delete',
    data: {
      column: 'cell_plan:data_plan_05gb',
    },
  };
});
await table.mutate(entries);
await printRows();

Borra datos de una vista autorizada

Para borrar los datos de una tabla, envía una solicitud de eliminación a una vista autorizada. Debes usar una de las siguientes opciones:

  • gcloud CLI
  • Cliente de Bigtable para Java

Cuando borras datos de una vista autorizada, proporcionas el ID de la vista autorizada además del ID de la tabla.

Los datos que puedes borrar de una vista autorizada están limitados por la definición de la vista. Solo puedes borrar los datos que se incluyen en la vista autorizada. Si intentas borrar datos que están fuera de la definición de vista autorizada o están sujetos a las siguientes reglas, se muestra un error de PERMISSION_DENIED:

  • No se admite borrar un rango de filas de una vista autorizada con DropRowRange en la API de administrador.
  • No se puede borrar desde una fila.
  • Se admite la eliminación de una columna, siempre que sea para filas que se encuentren en la vista autorizada.
  • La eliminación de una familia de columnas solo se permite si la familia de columnas especificada está configurada para permitir todos los prefijos de calificadores de columna (qualifier_prefixes="") en la vista autorizada.

Por ejemplo, si intentas borrar una fila especificada y esa fila contiene columnas en la tabla subyacente que no están en tu vista autorizada, la solicitud fallará.

¿Qué sigue?