Enumera conjuntos de datos
En este documento, se describe cómo enumerar y obtener información sobre los conjuntos de datos en BigQuery.
Antes de comenzar
Otorga roles de Identity and Access Management (IAM) que les brindan a los usuarios los permisos necesarios para realizar cada tarea de este documento.
Función requerida
Si deseas obtener el permiso que necesitas para enumerar conjuntos de datos o si quieres obtener información sobre los conjuntos de datos, pídele a tu administrador que te otorgue el rol de IAM de visualizador de metadatos de BigQuery (roles/bigquery.metadataViewer
) en tu proyecto.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene el permiso bigquery.datasets.get
, que es necesario para enumerar conjuntos de datos o, sino, obtener información sobre los conjuntos de datos.
También puedes obtener este permiso con roles personalizados o con otros roles predefinidos.
Cuando aplicas el rol roles/bigquery.metadataViewer
a nivel del proyecto o de la organización, puedes enumerar todos los conjuntos de datos en el proyecto. Cuando aplicas la función roles/bigquery.metadataViewer
a nivel de conjunto de datos, puedes enumerar todos los conjuntos de datos para los que se te otorgó esa función.
Mostrar lista de conjuntos de datos
Selecciona una de las opciones siguientes:
Console
En el menú de navegación, haz clic en BigQuery Studio.
En el panel Explorador, expande el nombre de un proyecto para ver los conjuntos de datos en ese proyecto o usa el cuadro de búsqueda para buscar por nombre de conjunto de datos.
SQL
Consulta la vista INFORMATION_SCHEMA.SCHEMATA
.
En la consola de Google Cloud, ve a la página de BigQuery.
En el editor de consultas, escribe la siguiente oración:
SELECT schema_name FROM PROJECT_ID.`region-REGION`.INFORMATION_SCHEMA.SCHEMATA;
Reemplaza lo siguiente:
PROJECT_ID
: El ID del proyecto de Google Cloud. Si no se especifica, se usa el proyecto predeterminado.REGION
: Cualquier nombre de región del conjunto de datos. Por ejemplo,us
.
Haz clic en
Ejecutar.
Si deseas obtener información sobre cómo ejecutar consultas, visita Ejecuta una consulta interactiva.
bq
Ingresa el comando bq ls
para enumerar los conjuntos de datos según el ID del conjunto de datos. Se puede usar la marca --format
para controlar el resultado. Para enumerar conjuntos de datos en un proyecto que no es el predeterminado, agrega la marca --project_id
al comando.
Para enumerar todos los conjuntos de datos de un proyecto, incluidos los conjuntos de datos anónimos, usa la marca --all
o el acceso directo -a
.
Para enumerar todos los conjuntos de datos de un proyecto, excepto los conjuntos de datos anónimos, usa la marca --datasets
o el acceso directo -d
. Esta marca es opcional. Como configuración predeterminada, no se enumeran los conjuntos de datos anónimos.
Entre las marcas adicionales, se incluyen las siguientes:
--filter
: Muestra una lista de los conjuntos de datos que coinciden con la expresión de filtro. Usa una lista de claves de etiquetas y valores separados por espacios en el formatolabels.key:value
. Para obtener más información sobre cómo filtrar conjuntos de datos con etiquetas, consulta cómo agregar y usar etiquetas.--max_results
o-n
: Un número entero que indica la cantidad máxima de resultados. El valor predeterminado es50
.
bq ls --filter labels.key:value \ --max_results integer \ --format=prettyjson \ --project_id project_id
Reemplaza lo siguiente:
- key:value: Una clave de etiqueta y un valor
- integer: Es un número entero que representa la cantidad de conjuntos de datos que se deben incluir en la lista.
- project_id: nombre del proyecto.
Ejemplos:
Ingresa el comando siguiente para enumerar todos los conjuntos de datos en tu proyecto predeterminado. --
format
se configura como “descriptivo” para que se devuelva una tabla con formato básico.
bq ls --format=pretty
Ingresa el siguiente comando para enumerar conjuntos de datos de myotherproject
. --format
se configura como prettyjson
para que se devuelvan resultados detallados en formato JSON.
bq ls --format=prettyjson --project_id myotherproject
Ingresa el siguiente comando para enumerar todos los conjuntos de datos, incluidos los conjuntos de datos anónimos de tu proyecto predeterminado. En el resultado, los conjuntos de datos anónimos comienzan con un guion bajo.
bq ls -a
Ingresa el siguiente comando para devolver más que el resultado predeterminado de 50 conjuntos de datos de tu proyecto predeterminado.
bq ls --max_results 60
Ingresa el siguiente comando para enumerar conjuntos de datos de tu proyecto predeterminado con la etiqueta org:dev
.
bq ls --filter labels.org:dev
API
Para enumerar conjuntos de datos con la API, realiza una llamada al método de API datasets.list
.
C#
Antes de probar este ejemplo, sigue las instrucciones de configuración para C# incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para C#.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Go
Antes de probar este ejemplo, sigue las instrucciones de configuración para Go incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Java
Antes de probar este ejemplo, sigue las instrucciones de configuración para Java incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Java.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Node.js
Antes de probar este ejemplo, sigue las instrucciones de configuración para Node.js incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Node.js.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
PHP
Antes de probar este ejemplo, sigue las instrucciones de configuración para PHP incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para PHP.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Python
Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Python.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Ruby
Antes de probar este ejemplo, sigue las instrucciones de configuración para Ruby incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Ruby.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Obtén información sobre los conjuntos de datos
Selecciona una de las opciones siguientes:
Console
En el panel Explorador, expande tu proyecto y selecciona un conjunto de datos.
Expande la opción Acciones
y haz clic en Abrir. La descripción y los detalles aparecen en el panel de detalles. Las tablas para un conjunto de datos se enumeran con el nombre del conjunto de datos en el panel Explorador.
De forma predeterminada, los conjuntos de datos anónimos se encuentran ocultos de la consola de Google Cloud. Para que se muestre información sobre los conjuntos de datos anónimos, usa la herramienta de línea de comandos de bq o la API.
SQL
Consulta la vista INFORMATION_SCHEMA.SCHEMATA
.
En la consola de Google Cloud, ve a la página de BigQuery.
En el editor de consultas, escribe la siguiente oración:
SELECT * EXCEPT (schema_owner) FROM PROJECT_ID.`region-REGION`.INFORMATION_SCHEMA.SCHEMATA;
Reemplaza lo siguiente:
-
PROJECT_ID
: El ID del proyecto de Google Cloud. Si no se especifica, se usa el proyecto predeterminado. -
REGION
: Cualquier nombre de región del conjunto de datos. Por ejemplo,us
.
-
Haz clic en
Ejecutar.
Para obtener más información sobre cómo ejecutar consultas, visita Ejecuta una consulta interactiva.
También puedes consultar la vista INFORMATION_SCHEMA.SCHEMATA_OPTIONS
.
SELECT * FROM PROJECT_ID.`region-REGION`.INFORMATION_SCHEMA.SCHEMATA_OPTIONS;
bq
Ejecuta el comando bq show
. La marca --format
se puede usar para controlar el resultado. Si quieres obtener información sobre un conjunto de datos en un proyecto que no es el predeterminado, agrega el ID del proyecto al nombre del conjunto de datos en el siguiente formato: project_id:dataset
.
Para mostrar información sobre un conjunto de datos oculto, usa el comando bq ls --all
para hacer una lista de todos los conjuntos de datos y, luego, ingresa el nombre del conjunto de datos oculto. conjunto de datos en el comando bq show
.
bq show --format=prettyjson project_id:dataset
Reemplaza lo siguiente:
- project_id es el nombre de tu proyecto.
- dataset es el nombre del conjunto de datos.
Ejemplos:
Ingresa el siguiente comando para mostrar información sobre mydataset
en tu proyecto predeterminado.
bq show --format=prettyjson mydataset
Ingresa el siguiente comando para mostrar información sobre mydataset
en myotherproject
.
bq show --format=prettyjson myotherproject:mydataset
Ingresa el siguiente comando para mostrar información sobre el conjunto de datos oculto _1234abcd56efgh78ijkl1234
en tu proyecto predeterminado.
bq show --format=prettyjson _1234abcd56efgh78ijkl1234
API
Realiza una llamada al método de la API datasets.get
y proporciona los parámetros relevantes.
Go
Antes de probar este ejemplo, sigue las instrucciones de configuración para Go incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Go.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Java
Antes de probar este ejemplo, sigue las instrucciones de configuración para Java incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Java.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Node.js
Antes de probar este ejemplo, sigue las instrucciones de configuración para Node.js incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Node.js.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Python
Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Python.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Verifica el nombre del conjunto de datos
En los siguientes ejemplos, se muestra cómo verificar si existe un conjunto de datos:
Java
Antes de probar este ejemplo, sigue las instrucciones de configuración para Java incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Java.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
Python
Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Python.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
¿Qué sigue?
- Para obtener más información sobre la creación de conjuntos de datos, consulta Crea conjuntos de datos.
- Para obtener más información sobre cómo asignar controles de acceso a los conjuntos de datos, consulta Controla el acceso a los conjuntos de datos.
- Si deseas obtener más información para cambiar las propiedades del conjunto de datos, consulta Actualiza las propiedades del conjunto de datos.
- Para obtener más información sobre cómo crear y administrar etiquetas, consulta cómo crear y administrar etiquetas.
- Para ver una descripción general de
INFORMATION_SCHEMA
, consulta Introducción aINFORMATION_SCHEMA
de BigQuery.