Consultar un conjunto de datos público y visualizar los resultados

Aprende a consultar un conjunto de datos público y a visualizar los resultados en BigQuery.


Para seguir las instrucciones paso a paso de esta tarea directamente en la Google Cloud consola, haga clic en Ayúdame:

Guíame


Antes de empezar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Conceder acceso.
    4. En el campo Nuevos principales, introduce tu identificador de usuario. Normalmente, se trata de la dirección de correo de una cuenta de Google.

    5. En la lista Selecciona un rol, elige un rol.
    6. Para conceder más roles, haz clic en Añadir otro rol y añade cada rol adicional.
    7. Haz clic en Guardar.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Conceder acceso.
    4. En el campo Nuevos principales, introduce tu identificador de usuario. Normalmente, se trata de la dirección de correo de una cuenta de Google.

    5. En la lista Selecciona un rol, elige un rol.
    6. Para conceder más roles, haz clic en Añadir otro rol y añade cada rol adicional.
    7. Haz clic en Guardar.
  6. Verify that billing is enabled for your Google Cloud project.

  7. Si no habilitas la facturación en el proyecto que usas en este tutorial, podrás consultar los datos públicos en el entorno aislado de BigQuery. Google Cloud El entorno aislado de BigQuery te permite familiarizarte con BigQuery con un conjunto limitado de funciones de BigQuery sin coste económico.

  8. Compruebe que la API de BigQuery esté habilitada.

    Habilitar la API

    Si has creado un proyecto, la API de BigQuery se habilita automáticamente.

  9. Ver un conjunto de datos público

    Los conjuntos de datos públicos de BigQuery están disponibles de forma predeterminada en BigQuery Studio en un proyecto llamado bigquery-public-data. En este tutorial, consultarás el conjunto de datos Desplazamientos de Citi Bike (Nueva York). Citi Bike es un programa de alquiler de bicicletas a gran escala que cuenta con 10.000 bicicletas y 600 estaciones en Manhattan, Brooklyn, Queens y Jersey City. Este conjunto de datos incluye los viajes de Citi Bike desde que se lanzó en septiembre del 2013.

    1. En la Google Cloud consola, ve a la página BigQuery.

      Ir a BigQuery

    2. En BigQuery Studio, en el panel Explorador, haz clic en Añadir datos.

    3. En el cuadro de diálogo Añadir datos, en el panel Filtrar por, haz clic en Icono de conjunto de datos público en la página Filtrar por Conjuntos de datos públicos.

    4. En la página Marketplace, escribe NYC Citi Bike Trips en el campo Buscar en Marketplace para acotar la búsqueda.

    5. En los resultados de búsqueda, haz clic en Desplazamientos de NYC Citi Bike.

    6. En la página Detalles del producto, haga clic en Ver conjunto de datos. Puedes ver información sobre el conjunto de datos en la pestaña Detalles.

    Consultar un conjunto de datos público

    En los siguientes pasos, consultarás la tabla citibike_trips para determinar las 100 estaciones de Citi Bike más populares del conjunto de datos público NYC Citi Bike Trips. La consulta obtiene el nombre y la ubicación de la estación, así como el número de viajes que han empezado en ella.

    La consulta usa la función ST_GEOGPOINT para crear un punto a partir de los parámetros de longitud y latitud de cada estación y devuelve ese punto en una columna GEOGRAPHY. La columna GEOGRAPHY se usa para generar un mapa de calor en el visor de datos geográficos integrado.

    1. En la Google Cloud consola, abre la página BigQuery.

      Ir a BigQuery

    2. Haz clic en Consulta de SQL.

    3. En el editor de consultas, introduce la siguiente consulta:

      SELECT
        start_station_name,
        start_station_latitude,
        start_station_longitude,
        ST_GEOGPOINT(start_station_longitude, start_station_latitude) AS geo_location,
        COUNT(*) AS num_trips
      FROM
        `bigquery-public-data.new_york.citibike_trips`
      GROUP BY
        1,
        2,
        3
      ORDER BY
        num_trips DESC
      LIMIT
        100;
      

      Si la consulta es válida, aparecerá una marca de verificación junto con la cantidad de datos que procesará la consulta. Si la consulta no es válida, aparecerá un signo de exclamación junto con un mensaje de error.

      Validador de consultas

    4. Haz clic en Ejecutar. Las emisoras más populares se muestran en la sección Resultados de la consulta.

      Resultados de la consulta en la consola Google Cloud

    5. Opcional: Para ver la duración del trabajo y la cantidad de datos que ha procesado el trabajo de consulta, haga clic en la pestaña Información del trabajo de la sección Resultados de la consulta.

    6. Cambia a la pestaña Visualización. Esta pestaña genera un mapa para visualizar rápidamente los resultados.

    7. En el panel Configuración de visualización:

      1. Verifica que Tipo de visualización sea Mapa.
      2. Verifica que la opción Columna geográfica esté configurada como geo_location.
      3. En Columna de datos, elige num_trips.
      4. Usa la opción Ampliar para ver el mapa de Manhattan.

      Mapa de calor generado en la pestaña Visualización

    Limpieza

    Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.

    Eliminar el proyecto

    Si has usado el entorno aislado de BigQuery para consultar el conjunto de datos público, la facturación no estará habilitada en tu proyecto y no tendrás que eliminarlo.

    La forma más fácil de evitar que te cobren es eliminar el proyecto que has creado para el tutorial.

    Para ello, sigue las instrucciones que aparecen a continuación:

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    Siguientes pasos