Administra datos de tablas

En este documento, se describe cómo administrar datos de tablas en BigQuery. Puedes trabajar con datos de tablas de BigQuery de las siguientes maneras:

Carga datos en una tabla
Adjuntar datos de tablas o reemplazarlos
Explorar datos de tablas (o bien, obtener una vista previa)
Consultar datos de tablas
Modificar datos de tablas con el uso del lenguaje de manipulación de datos (DML)
Copiar datos de tablas
Exportar datos de tablas

Si deseas obtener más información sobre cómo administrar esquemas de tablas, consulta Modifica esquemas de tablas.

Antes de comenzar

Otorga funciones que otorguen los permisos necesarios a los usuarios que necesitan realizar cada tarea en este documento. Los permisos necesarios (si hubiera) para realizar una tarea se enumeran en la sección “Permisos necesarios” de la tarea.

Cargar datos en una tabla

Puedes cargar datos cuando creas una tabla, o puedes crear una tabla vacía y cargar los datos más tarde. Cuando cargas datos, puedes usar la detección automática de esquemas para los formatos de datos admitidos o puedes especificar el esquema.

A fin de obtener más información sobre la carga de datos, consulta la documentación para el formato y la ubicación de tus datos de origen:

Para obtener más información sobre cómo cargar datos desde Cloud Storage, consulta lo siguiente:
Si deseas obtener más información para cargar datos desde una fuente local, consulta Carga datos desde archivos locales.

Adjunta y reemplaza datos de tablas

Puedes reemplazar los datos de las tablas mediante una operación de carga o consulta. Puedes agregar datos adicionales a una tabla existente; para ello, realiza una operación de adición de carga o agrega los resultados de la consulta a la tabla.

Si deseas obtener más información sobre cómo agregar o reemplazar una tabla cuando se cargan datos, consulta la documentación para el formato de datos de origen:

Para agregar o reemplazar una tabla mediante los resultados de la consulta, especifica una tabla de destino y configura la disposición de escritura en:

Agregar a la tabla: Agrega los resultados de la consulta a una tabla existente.
Reemplazar la tabla: reemplaza una tabla existente con el mismo nombre mediante los resultados de la consulta.

Puedes usar la siguiente consulta para agregar registros de una tabla a otra:

  INSERT INTO .. (
    ,
    ) (SELECT * FROM ..)

Si deseas obtener más información sobre cómo usar los resultados de la consulta para anexar o reemplazar datos, consulta Escribe resultados de consultas.

Explora datos de la tabla

Puedes explorar los datos de tablas de las siguientes maneras:

Usa la consola de Google Cloud
Usa el comando bq head de la herramienta de línea de comandos de bq
Llamar al método de la API tabledata.list
Con las bibliotecas cliente

Permisos necesarios

Para explorar datos de tablas y particiones, necesitas el permiso de administración de identidades y accesos (IAM) bigquery.tables.getData.

Cada una de las siguientes funciones predefinidas de IAM incluye los permisos que necesitas para explorar los datos de la tabla y la partición:

roles/bigquery.dataViewer
roles/bigquery.dataEditor
roles/bigquery.dataOwner
roles/bigquery.admin

Si tienes el permiso bigquery.datasets.create, puedes explorar los datos de las tablas y particiones de los conjuntos de datos que crees.

Para obtener más información sobre las funciones y los permisos de IAM en BigQuery, consulta Funciones y permisos predefinidos.

Explora datos de la tabla

Para explorar datos de tablas:

Console

En la consola de Google Cloud, abre la página de BigQuery.

Ir a BigQuery
En el panel Explorador, expande tu proyecto y selecciona un conjunto de datos.
Haz clic en una tabla de la lista.
Haz clic en Detalles y anota el valor de Número de filas. Es posible que necesites este valor para controlar el punto de partida de tus resultados mediante la herramienta de línea de comandos de bq o la API.
Haz clic en Vista previa. Verás un conjunto de datos de muestra.

Línea de comandos

Emite el comando bq head con la marca --max_rows para enumerar todas las columnas en una cantidad determinada de filas de la tabla. Si no se especifica --max_rows, el valor predeterminado es 100.

Para explorar un subconjunto de columnas en la tabla (incluidas las columnas anidadas y repetidas), usa la marca --selected_fields y, luego, ingresa las columnas como una lista separada por comas.

Para especificar la cantidad de filas que se deben omitir antes de mostrar los datos de la tabla, usa la marca --start_row=integer (o la combinación de teclas -s). El valor predeterminado es 0. Puedes recuperar la cantidad de filas de una tabla si usas el comando bq show para recuperar la información de la tabla.

Si la tabla que exploras está en un proyecto que no es el predeterminado, debes agregar el ID del proyecto al comando con el formato siguiente: project_id:dataset.table.

bq head \
--max_rows integer1 \
--start_row integer2 \
--selected_fields "columns" \
project_id:dataset.table

En el ejemplo anterior, se ilustra lo siguiente:

integer1 es el número de filas para mostrar.
integer2 es el número de filas que se deben omitir antes de mostrar los datos.
columns es una lista de columnas separadas por comas.
project_id es el ID del proyecto.
dataset es el nombre del conjunto de datos que contiene la tabla.
table es el nombre de la tabla que se explorará.

Ejemplos:

Ingresa el siguiente comando para enumerar todas las columnas de las primeras 10 filas de mydataset.mytable. mydataset está en tu proyecto predeterminado.

bq head --max_rows=10 mydataset.mytable

Ingresa el siguiente comando para enumerar todas las columnas de las primeras 100 filas de mydataset.mytable. mydataset se encuentra en myotherproject, no en el proyecto predeterminado.

bq head myotherproject:mydataset.mytable

Ingresa el siguiente comando para mostrar solo field1 y field2 en mydataset.mytable. El comando usa la marca --start_row para saltar a la fila 100. mydataset.mytable está en tu proyecto predeterminado.

bq head --start_row 100 --selected_fields "field1,field2" mydataset.mytable

Debido a que el comando bq head no crea un trabajo de consulta, los comandos bq head no aparecen en tu historial de consultas y no se te cobra por ellos.

API

Explora los datos de una tabla mediante una llamada a tabledata.list. Especifica el nombre de la tabla en el parámetro tableId.

Configura estos parámetros opcionales para controlar la salida:

maxResults: cantidad máxima de resultados que se mostrarán
selectedFields: lista de columnas separadas por comas que se mostrará; si no se especifica, se mostrarán todas las columnas
startIndex: índice basado en cero de la primera fila que debe leerse

Los valores se muestran unidos en un objeto JSON que debes analizar, como se describe en la documentación de referencia de tabledata.list.