Consultar un conjunto de datos públicos y visualizar los resultados

Aprende a consultar un conjunto de datos públicos y a visualizar los resultados en BigQuery.


Para seguir la guía paso a paso sobre esta tarea directamente en la consola Google Cloud , haz clic en Guiarme:

GUIARME


Antes de comenzar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Otorgar acceso.
    4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

    5. En la lista Seleccionar un rol, elige uno.
    6. Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
    7. Haz clic en Guardar.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Otorgar acceso.
    4. En el campo Principales nuevas, ingresa tu identificador de usuario. Esta suele ser la dirección de correo electrónico de una Cuenta de Google.

    5. En la lista Seleccionar un rol, elige uno.
    6. Para otorgar roles adicionales, haz clic en Agregar otro rol y agrega uno más.
    7. Haz clic en Guardar.
  6. Verify that billing is enabled for your Google Cloud project.

  7. Si no habilitas la facturación para el proyecto de Google Cloud que uses en este instructivo, deberás consultar los datos públicos en la zona de pruebas de BigQuery. La zona de pruebas de BigQuery te permite comprender la plataforma con un conjunto limitado de funciones de BigQuery sin cargo.

  8. Asegúrate de que la API de BigQuery esté habilitada.

    Habilitación de la API

    Si creaste un proyecto nuevo, la API de BigQuery se habilita de forma automática.

  9. Cómo ver un conjunto de datos públicos

    Los conjuntos de datos públicos de BigQuery están disponibles de forma predeterminada en BigQuery Studio en un proyecto llamado bigquery-public-data. En este instructivo, consultarás el conjunto de datos de viajes de Citi Bike en NYC. Citi Bike es un programa de bicicletas compartidas grande, con 10,000 bicicletas y 600 estaciones en Manhattan, Brooklyn, Queens y Jersey City. Este conjunto de datos incluye viajes de Citi Bike desde que este programa se lanzó en septiembre de 2013.

    1. En la consola de Google Cloud , ve a la página BigQuery.

      Ir a BigQuery

    2. En BigQuery Studio, en el panel Explorador, haz clic en Agregar datos.

    3. En el cuadro de diálogo Agregar datos, en el panel Filtrar por, haz clic en Ícono de conjunto de datos públicos en la página Filtra por Conjuntos de datos públicos.

    4. En la página Marketplace, en el campo Buscar en Marketplace, escribe NYC Citi Bike Trips para acotar la búsqueda.

    5. En los resultados de la búsqueda, haz clic en NYC Citi Bike Trips.

    6. En la página Detalles del producto, haz clic en Ver conjunto de datos. Puedes ver información sobre el conjunto de datos en la pestaña Detalles.

    Consulta un conjunto de datos públicos

    En los siguientes pasos, consultarás la tabla citibike_trips para determinar las 100 estaciones de Citi Bike más populares en el conjunto de datos públicos de viajes de Citi Bike en NYC. La consulta recupera el nombre y la ubicación de la estación, y la cantidad de viajes que comenzaron en ella.

    La consulta usa la función ST_GEOGPOINT para crear un punto a partir de los parámetros de longitud y latitud de cada estación, y muestra ese punto en una columna GEOGRAPHY. La columna GEOGRAPHY se usa para generar un mapa de calor en el visualizador de datos geográficos integrado.

    1. En la consola de Google Cloud , abre la página de BigQuery.

      Ir a BigQuery

    2. Haz clic en Consulta en SQL.

    3. En el editor de consultas, ingresa la siguiente consulta:

      SELECT
        start_station_name,
        start_station_latitude,
        start_station_longitude,
        ST_GEOGPOINT(start_station_longitude, start_station_latitude) AS geo_location,
        COUNT(*) AS num_trips
      FROM
        `bigquery-public-data.new_york.citibike_trips`
      GROUP BY
        1,
        2,
        3
      ORDER BY
        num_trips DESC
      LIMIT
        100;
      

      Si la consulta es válida, aparecerá una marca de verificación junto con la cantidad de datos que procesa la consulta. Si no es válida, aparecerá un signo de exclamación junto con un mensaje de error.

      Validador de consultas

    4. Haz clic en Ejecutar. Las estaciones más populares se enumeran en la sección Resultados de la consulta.

      Resultados de la consulta en la consola de Google Cloud

    5. Opcional: Para mostrar la duración del trabajo y la cantidad de datos que procesó el trabajo de consulta, haz clic en la pestaña Información del trabajo en la sección Resultados de la consulta.

    6. Cambia a la pestaña Visualización. En esta pestaña, se genera un mapa para visualizar rápidamente tus resultados.

    7. En el panel Configuración de visualización, haz lo siguiente:

      1. Verifica que el Tipo de visualización esté configurado como Mapa.
      2. Verifica que la columna de ubicación geográfica esté configurada como geo_location.
      3. En Columna de datos, elige num_trips.
      4. Usa la opción Acercar para ver el mapa de Manhattan.

      Mapa de calor generado en la pestaña Visualización

    Limpia

    Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

    Borra el proyecto

    Si usaste la zona de pruebas de BigQuery para consultar el conjunto de datos públicos, la facturación no estará habilitada para tu proyecto y no es necesario que lo borres.

    La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

    Para borrar el proyecto, sigue estos pasos:

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    ¿Qué sigue?