Administra conjuntos de datos

En este documento, se describe cómo administrar conjuntos de datos en BigQuery. Después de crear un conjunto de datos, puedes administrarlo de las siguientes maneras:

Cambia nombre a los conjuntos de datos

En la actualidad, no puedes cambiar el nombre de un conjunto de datos existentes, pero puedes copiar un conjunto de datos. Consulta Copia conjuntos de datos.

Copia conjuntos de datos

Si deseas ver los pasos para copiar un conjunto de datos, incluso entre regiones, consulta cómo copiar conjuntos de datos.

Mueve un conjunto de datos

Para mover un conjunto de datos de una ubicación a otra de forma manual, sigue este proceso:

  1. Exporta los datos desde tus tablas de BigQuery a un depósito de Cloud Storage regional o multirregión en la misma ubicación que tu conjunto de datos. Por ejemplo, si tu conjunto de datos se encuentra en la ubicación multirregión de la UE, debes exportar tus datos a un depósito regional o multirregión en la UE.

    No se aplican cargos por exportar datos desde BigQuery, pero sí por almacenar los datos exportados en Cloud Storage. Las exportaciones de BigQuery están sujetas a los límites de los trabajos de exportación.

  2. Copia o mueve los datos de tu depósito de Cloud Storage a un depósito regional o multirregión en la ubicación nueva. Por ejemplo, si trasladas tus datos desde la ubicación multirregión de EE.UU. a la ubicación regional de Tokio, debes transferir los datos a un depósito regional en Tokio. Para obtener más información sobre la transferencia de objetos de Cloud Storage, consulta cómo cambiar nombre, copiar y mover objetos en la documentación de Cloud Storage.

    Ten en cuenta que la transferencia de datos entre regiones incurre en cargos de salida de red en Cloud Storage.

  3. Después de transferir los datos a un depósito de Cloud Storage en la ubicación nueva, crea un conjunto de datos nuevo de BigQuery (en la ubicación nueva). Luego, carga tus datos del depósito de Cloud Storage en BigQuery.

    No se te cobrará por cargar los datos en BigQuery, pero sí por almacenar los datos en Cloud Storage hasta que borres los datos o el depósito. También se te cobra por almacenar los datos en BigQuery después de que se carguen. La carga de datos en BigQuery está sujeta a los límites de los trabajos de carga.

A fin de obtener más información sobre el uso de Cloud Storage para almacenar y mover conjuntos de datos grandes, consulta Usa Cloud Storage con macrodatos.

Borrar conjuntos de datos

Puedes borrar un conjunto de datos:

  • Usa Cloud Console o la IU web clásica de BigQuery.
  • Usa el comando bq rm de CLI
  • Realiza una llamada al método de API datasets.delete
  • Con las bibliotecas cliente

Permisos necesarios

Como mínimo, para borrar un conjunto de datos, debes tener los permisos bigquery.datasets.delete. Si el conjunto de datos contiene tablas o vistas, también se requiere bigquery.tables.delete. Las siguientes funciones predefinidas de Cloud IAM incluyen los permisos bigquery.datasets.delete y bigquery.tables.delete:

  • bigquery.dataOwner
  • bigquery.admin

Además, si un usuario tiene permisos bigquery.datasets.create, cuando crea un conjunto de datos, se le otorga el acceso bigquery.dataOwner. El acceso de bigquery.dataOwner le da al usuario la capacidad de borrar los conjuntos de datos y tablas que crea.

Para obtener más información sobre las funciones de Cloud IAM y los permisos en BigQuery, consulta Funciones y permisos predefinidos.

Borra un conjunto de datos

Cuando borras un conjunto de datos mediante Cloud Console o la IU web clásica, las tablas y vistas en él (y los datos que contienen) se borran. Cuando borras un conjunto de datos mediante la CLI, debes usar la marca -r para borrar sus tablas y vistas.

Realiza los siguientes pasos para borrar un conjunto de datos:

Console

  1. Selecciona tu conjunto de datos desde el panel Recursos (Resources) y, a continuación, haz clic en Borrar conjunto de datos (Delete dataset) a la derecha de la ventana.

    Borrar conjunto de datos

  2. En el cuadro de diálogo Borrar conjunto de datos, escribe el nombre del conjunto de datos en el cuadro de texto y, luego, haz clic en Borrar.

IU clásica

  1. Haz clic en el ícono de la flecha hacia abajo ícono de flecha hacia abajo junto al nombre de tu conjunto de datos en la navegación y haz clic en Borrar conjunto de datos (Delete dataset).

  2. En el cuadro de diálogo Borrar conjunto de datos (Delete Dataset):

    • Para el ID del conjunto de datos, ingresa el nombre del conjunto de datos que deseas borrar.
    • Haz clic en Aceptar.

CLI

Usa el comando bq rm con la marca de acceso directo -d o --dataset (opcional) para borrar un conjunto de datos. Cuando usas la CLI para quitar un conjunto de datos, debes confirmar el comando. Puedes usar la marca -f para omitir la confirmación.

Además, si el conjunto de datos contiene tablas, debes usar la marca -r para quitar todas las tablas del conjunto de datos. Si borras una tabla en un proyecto que no sea tu proyecto predeterminado, agrega el ID del proyecto al nombre del conjunto de datos en el siguiente formato: project_id:dataset.

bq rm -r -f -d <var>project_id:dataset</var>

Esta es una explicación de los parámetros del ejemplo anterior:

  • project_id es el ID del proyecto.
  • dataset es el nombre del conjunto de datos que quieres borrar.

Por ejemplo:

Ingresa el siguiente comando para quitar mydataset y todas las tablas que contiene de tu proyecto predeterminado. El comando usa el acceso directo opcional -d.

bq rm -r -d mydataset

Cuando se te solicite, escribe y y presione Entrar.

Ingresa el siguiente comando para quitar mydataset y todas las tablas que contiene de myotherproject. El comando no usa el acceso directo -d opcional. La marca -f se usa para omitir la confirmación.

bq rm -r -f myotherproject:mydataset

API

Llama al método datasets.delete a fin de borrar el conjunto de datos y establece el parámetro deleteContents en true para borrar las tablas que contiene.

Go

Antes de probar este ejemplo, sigue las instrucciones de configuración de Go incluidas en la guía de inicio rápido de BigQuery con bibliotecas cliente. A fin de obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.

if err := client.Dataset(datasetID).Delete(ctx); err != nil {
	return fmt.Errorf("Failed to delete dataset: %v", err)
}

Java

Antes de probar este ejemplo, sigue las instrucciones de configuración de Go incluidas en la guía de inicio rápido de BigQuery con bibliotecas cliente. A fin de obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.

if err := client.Dataset(datasetID).Delete(ctx); err != nil {
	return fmt.Errorf("Failed to delete dataset: %v", err)
}

Node.js

Antes de probar este ejemplo, sigue las instrucciones de configuración de Go incluidas en la guía de inicio rápido de BigQuery con bibliotecas cliente. A fin de obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.

if err := client.Dataset(datasetID).Delete(ctx); err != nil {
	return fmt.Errorf("Failed to delete dataset: %v", err)
}

PHP

Antes de probar este ejemplo, sigue las instrucciones de configuración de Go incluidas en la guía de inicio rápido de BigQuery con bibliotecas cliente. A fin de obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.

if err := client.Dataset(datasetID).Delete(ctx); err != nil {
	return fmt.Errorf("Failed to delete dataset: %v", err)
}

Python

Antes de probar este ejemplo, sigue las instrucciones de configuración de Go incluidas en la guía de inicio rápido de BigQuery con bibliotecas cliente. A fin de obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.

if err := client.Dataset(datasetID).Delete(ctx); err != nil {
	return fmt.Errorf("Failed to delete dataset: %v", err)
}

Ruby

Antes de probar este ejemplo, sigue las instrucciones de configuración de Go incluidas en la guía de inicio rápido de BigQuery con bibliotecas cliente. A fin de obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.

if err := client.Dataset(datasetID).Delete(ctx); err != nil {
	return fmt.Errorf("Failed to delete dataset: %v", err)
}

Próximos pasos

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Si necesitas ayuda, visita nuestra página de asistencia.