Consultar un conjunto de datos públicos y visualizar los resultados
Aprende a consultar un conjunto de datos públicos y a visualizar los resultados en BigQuery.
Para seguir la guía paso a paso sobre esta tarea directamente en la consola Google Cloud , haz clic en Guiarme:
Antes de comenzar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Ir a IAM - Selecciona el proyecto.
- Haz clic en Otorgar acceso.
-
En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.
- En la lista Seleccionar un rol, elige uno.
- Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
- Haz clic en Guardar.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Ir a IAM - Selecciona el proyecto.
- Haz clic en Otorgar acceso.
-
En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.
- En la lista Seleccionar un rol, elige uno.
- Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
- Haz clic en Guardar.
-
-
Verify that billing is enabled for your Google Cloud project.
Asegúrate de que la API de BigQuery esté habilitada.
Si creaste un proyecto nuevo, la API de BigQuery se habilita de forma automática.
En la consola de Google Cloud , ve a la página BigQuery.
En BigQuery Studio, en el panel Explorador, haz clic en
Agregar datos.En el cuadro de diálogo Agregar datos, en el panel Filtrar por, haz clic en
Conjuntos de datos públicos.
En la página Marketplace, en el campo Buscar en Marketplace, escribe
NYC Citi Bike Trips
para acotar la búsqueda.En los resultados de la búsqueda, haz clic en NYC Citi Bike Trips.
En la página Detalles del producto, haz clic en Ver conjunto de datos. Puedes ver información sobre el conjunto de datos en la pestaña Detalles.
En la consola de Google Cloud , abre la página de BigQuery.
Haz clic en
Consulta en SQL .En el
editor de consultas , ingresa la siguiente consulta:SELECT start_station_name, start_station_latitude, start_station_longitude, ST_GEOGPOINT(start_station_longitude, start_station_latitude) AS geo_location, COUNT(*) AS num_trips FROM `bigquery-public-data.new_york.citibike_trips` GROUP BY 1, 2, 3 ORDER BY num_trips DESC LIMIT 100;
Si la consulta es válida, aparecerá una marca de verificación junto con la cantidad de datos que procesa la consulta. Si no es válida, aparecerá un signo de exclamación junto con un mensaje de error.
Haz clic en
Ejecutar . Las estaciones más populares se enumeran en la secciónResultados de la consulta .Opcional: Para mostrar la duración del trabajo y la cantidad de datos que procesó el trabajo de consulta, haz clic en la pestaña Información del trabajo en la sección Resultados de la consulta.
Cambia a la pestaña
Visualización . En esta pestaña, se genera un mapa para visualizar rápidamente tus resultados.En el panel Configuración de visualización, haz lo siguiente:
- Verifica que el Tipo de visualización esté configurado como Mapa.
- Verifica que la columna de ubicación geográfica esté configurada como
geo_location
. - En Columna de datos, elige
num_trips
. - Usa la opción Acercar para ver el mapa de Manhattan.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
- Obtén más información sobre la zona de pruebas de BigQuery.
- Aprende a crear un conjunto de datos, cargar datos y consultar tablas en BigQuery.
Si no habilitas la facturación para el proyecto de Google Cloud que uses en este instructivo, deberás consultar los datos públicos en la zona de pruebas de BigQuery. La zona de pruebas de BigQuery te permite comprender la plataforma con un conjunto limitado de funciones de BigQuery sin cargo.
Cómo ver un conjunto de datos públicos
Los conjuntos de datos públicos de BigQuery están disponibles de forma predeterminada en BigQuery Studio en un proyecto llamado bigquery-public-data
. En este instructivo, consultarás el conjunto de datos de viajes de Citi Bike en NYC. Citi Bike es un programa de bicicletas compartidas grande, con 10,000 bicicletas y 600 estaciones en Manhattan, Brooklyn, Queens y Jersey City. Este conjunto de datos incluye viajes de Citi Bike desde que este programa se lanzó en septiembre de 2013.
Consulta un conjunto de datos públicos
En los siguientes pasos, consultarás la tabla citibike_trips
para determinar las 100 estaciones de Citi Bike más populares en el conjunto de datos públicos de viajes de Citi Bike en NYC.
La consulta recupera el nombre y la ubicación de la estación, y la cantidad de viajes que comenzaron en ella.
La consulta usa la función ST_GEOGPOINT para crear un punto a partir de los parámetros de longitud y latitud de cada estación, y muestra ese punto en una columna GEOGRAPHY
. La columna GEOGRAPHY
se usa para generar un mapa de calor en el visualizador de datos geográficos integrado.
Limpia
Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.
Borra el proyecto
Si usaste la zona de pruebas de BigQuery para consultar el conjunto de datos públicos, la facturación no estará habilitada para tu proyecto y no es necesario que lo borres.
La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.
Para borrar el proyecto, sigue estos pasos: