Mostrar conjuntos de datos
En este documento se describe cómo enumerar y obtener información sobre los conjuntos de datos de BigQuery.
Antes de empezar
Concede roles de gestión de identidades y accesos (IAM) que proporcionen a los usuarios los permisos necesarios para realizar cada tarea de este documento.
Rol necesario
Para obtener el permiso que necesitas para enumerar conjuntos de datos u obtener información sobre ellos, pide a tu administrador que te conceda el rol de gestión de identidades y accesos Lector de metadatos de BigQuery (roles/bigquery.metadataViewer
) en tu proyecto.
Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene el permiso bigquery.datasets.get
, que es necesario para enumerar conjuntos de datos u obtener información sobre ellos.
También puedes obtener este permiso con roles personalizados u otros roles predefinidos.
Si asignas el rol roles/bigquery.metadataViewer
a nivel de proyecto o de organización, puedes consultar todos los conjuntos de datos del proyecto. Cuando aplicas el rol roles/bigquery.metadataViewer
a nivel de conjunto de datos, puedes enumerar todos los conjuntos de datos a los que se te ha asignado ese rol.
Mostrar conjuntos de datos
Selecciona una de las opciones siguientes:
Consola
En el menú de navegación, haz clic en Studio.
En el panel Explorador, despliega el nombre de un proyecto para ver los conjuntos de datos que contiene o usa el cuadro de búsqueda para buscar por nombre de conjunto de datos.
SQL
Consulta la vista INFORMATION_SCHEMA.SCHEMATA
:
En la Google Cloud consola, ve a la página BigQuery.
En el editor de consultas, introduce la siguiente instrucción:
SELECT schema_name FROM PROJECT_ID.`region-REGION`.INFORMATION_SCHEMA.SCHEMATA;
Haz los cambios siguientes:
PROJECT_ID
: el ID de tu proyecto deGoogle Cloud . Si no se especifica, se usa el proyecto predeterminado.REGION
: cualquier nombre de región del conjunto de datos. Por ejemplo,us
.
Haz clic en
Ejecutar.
Para obtener más información sobre cómo ejecutar consultas, consulta Ejecutar una consulta interactiva.
bq
Ejecuta el comando bq ls
para mostrar los conjuntos de datos por ID. La marca --format
se puede usar para controlar el resultado. Si vas a enumerar un conjunto de datos en un proyecto que no sea el predeterminado, añade la marca --project_id
al comando.
Para enumerar todos los conjuntos de datos de un proyecto, incluidos los conjuntos de datos ocultos, usa la marca --all
o el acceso directo -a
.
Para enumerar todos los conjuntos de datos de un proyecto, excepto los ocultos, usa la marca --datasets
o el acceso directo -d
. Esta marca es opcional. De forma predeterminada, los conjuntos de datos ocultos no se muestran.
Entre las marcas adicionales se incluyen las siguientes:
--filter
: muestra los conjuntos de datos que coinciden con la expresión de filtro. Usa una lista de claves y valores de etiquetas separados por espacios con el formatolabels.key:value
. Para obtener más información sobre cómo filtrar conjuntos de datos con etiquetas, consulta el artículo Añadir y usar etiquetas.--max_results
o-n
: número entero que indica el número máximo de resultados. El valor predeterminado es50
.
bq ls --filter labels.key:value \ --max_results integer \ --format=prettyjson \ --project_id project_id
Haz los cambios siguientes:
- key:value: una clave y un valor de etiqueta
- integer: un número entero que representa el número de conjuntos de datos que se van a enumerar.
- project_id: el nombre de tu proyecto
Ejemplos:
Introduce el siguiente comando para ver una lista de los conjuntos de datos de tu proyecto predeterminado. --
format
se define como "pretty" para devolver una tabla con formato básico.
bq ls --format=pretty
Introduce el siguiente comando para enumerar los conjuntos de datos de myotherproject
. --format
se define como prettyjson
para devolver resultados detallados en formato JSON.
bq ls --format=prettyjson --project_id myotherproject
Introduce el siguiente comando para ver una lista de todos los conjuntos de datos, incluidos los ocultos, de tu proyecto predeterminado. En el resultado, los conjuntos de datos ocultos empiezan por un guion bajo.
bq ls -a
Introduce el siguiente comando para devolver más de los 50 conjuntos de datos predeterminados de tu proyecto predeterminado.
bq ls --max_results 60
Introduce el siguiente comando para ver una lista de los conjuntos de datos de tu proyecto predeterminado con la etiqueta org:dev
.
bq ls --filter labels.org:dev
API
Para enumerar conjuntos de datos mediante la API, llama al método de API datasets.list
.
C#
Antes de probar este ejemplo, sigue las C#instrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API C# de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Go
Antes de probar este ejemplo, sigue las Goinstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Go de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Java
Antes de probar este ejemplo, sigue las Javainstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Java de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Node.js
Antes de probar este ejemplo, sigue las Node.jsinstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Node.js de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
PHP
Antes de probar este ejemplo, sigue las PHPinstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API PHP de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Python
Antes de probar este ejemplo, sigue las Pythoninstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Python de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Ruby
Antes de probar este ejemplo, sigue las Rubyinstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Ruby de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Obtener información sobre los conjuntos de datos
Selecciona una de las opciones siguientes:
Consola
En el panel Explorador, expande tu proyecto y selecciona un conjunto de datos.
Abre la opción
Acciones y haz clic en Abrir. La descripción y los detalles aparecen en el panel de detalles. Las tablas de un conjunto de datos se muestran con el nombre del conjunto de datos en el panel Explorador.
De forma predeterminada, los conjuntos de datos ocultos no se muestran en la consola Google Cloud . Para mostrar información sobre conjuntos de datos ocultos, usa la herramienta de línea de comandos bq o la API.
SQL
Consulta la vista INFORMATION_SCHEMA.SCHEMATA
:
En la Google Cloud consola, ve a la página BigQuery.
En el editor de consultas, introduce la siguiente instrucción:
SELECT * EXCEPT (schema_owner) FROM PROJECT_ID.`region-REGION`.INFORMATION_SCHEMA.SCHEMATA;
Haz los cambios siguientes:
-
PROJECT_ID
: el ID de tu proyecto de Google Cloud . Si no se especifica, se usa el proyecto predeterminado. -
REGION
: cualquier nombre de región del conjunto de datos. Por ejemplo,us
.
-
Haz clic en
Ejecutar.
Para obtener más información sobre cómo ejecutar consultas, consulta Ejecutar una consulta interactiva.
También puedes consultar la vista INFORMATION_SCHEMA.SCHEMATA_OPTIONS
.
SELECT * FROM PROJECT_ID.`region-REGION`.INFORMATION_SCHEMA.SCHEMATA_OPTIONS;
bq
Ejecuta el comando bq show
. La marca --format
se puede usar para controlar la salida. Si quieres obtener información sobre un conjunto de datos de un proyecto que no sea el predeterminado, añade el ID del proyecto al nombre del conjunto de datos con el siguiente formato: project_id:dataset
.
En la salida se muestra la información del conjunto de datos, como el control de acceso, las etiquetas y la ubicación. Este comando no muestra los permisos heredados de un conjunto de datos, pero puedes consultarlos en la Google Cloud consola.
Para mostrar información sobre un conjunto de datos oculto, usa el comando bq ls --all
para enumerar todos los conjuntos de datos y, a continuación, usa el nombre del conjunto de datos oculto en el comando bq show
.
bq show --format=prettyjson project_id:dataset
Haz los cambios siguientes:
- project_id es el nombre de tu proyecto.
- dataset es el nombre del conjunto de datos.
Ejemplos:
Introduce el siguiente comando para mostrar información sobre mydataset
en tu proyecto predeterminado.
bq show --format=prettyjson mydataset
Introduce el siguiente comando para mostrar información sobre mydataset
en myotherproject
.
bq show --format=prettyjson myotherproject:mydataset
Introduce el siguiente comando para mostrar información sobre el conjunto de datos oculto
_1234abcd56efgh78ijkl1234
en tu proyecto predeterminado.
bq show --format=prettyjson _1234abcd56efgh78ijkl1234
API
Llama al método de API datasets.get
y proporciona los parámetros pertinentes.
Go
Antes de probar este ejemplo, sigue las Goinstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Go de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Java
Antes de probar este ejemplo, sigue las Javainstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Java de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Node.js
Antes de probar este ejemplo, sigue las Node.jsinstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Node.js de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Python
Antes de probar este ejemplo, sigue las Pythoninstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Python de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Verificar el nombre del conjunto de datos
En los siguientes ejemplos se muestra cómo comprobar si existe un conjunto de datos:
Java
Antes de probar este ejemplo, sigue las Javainstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Java de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Python
Antes de probar este ejemplo, sigue las Pythoninstrucciones de configuración de la guía de inicio rápido de BigQuery con bibliotecas de cliente. Para obtener más información, consulta la documentación de referencia de la API Python de BigQuery.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación para bibliotecas de cliente.
Siguientes pasos
- Para obtener más información sobre cómo crear conjuntos de datos, consulte el artículo Crear conjuntos de datos.
- Para obtener más información sobre cómo asignar controles de acceso a conjuntos de datos, consulta el artículo Controlar el acceso a los conjuntos de datos.
- Para obtener más información sobre cómo cambiar las propiedades de los conjuntos de datos, consulte Actualizar propiedades de los conjuntos de datos.
- Para obtener más información sobre cómo crear y gestionar etiquetas, consulta el artículo Crear y gestionar etiquetas.
- Para ver un resumen de
INFORMATION_SCHEMA
, consulta el artículo Introducción a BigQueryINFORMATION_SCHEMA
.