Consultar um conjunto de dados público e visualizar os resultados

Saiba como consultar um conjunto de dados público e visualizar os resultados no BigQuery.


Para seguir as instruções detalhadas desta tarefa diretamente no console do Google Cloud , clique em Orientação:

Orientações


Antes de começar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Acessar o IAM
    2. Selecione o projeto.
    3. Clique em Conceder acesso.
    4. No campo Novos principais, insira seu identificador de usuário. Normalmente, é o endereço de e-mail de uma Conta do Google.

    5. Na lista Selecionar um papel, escolha um.
    6. Para conceder outros papéis, adicione-os clicando em Adicionar outro papel.
    7. Clique em Salvar.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Acessar o IAM
    2. Selecione o projeto.
    3. Clique em Conceder acesso.
    4. No campo Novos principais, insira seu identificador de usuário. Normalmente, é o endereço de e-mail de uma Conta do Google.

    5. Na lista Selecionar um papel, escolha um.
    6. Para conceder outros papéis, adicione-os clicando em Adicionar outro papel.
    7. Clique em Salvar.
  6. Verify that billing is enabled for your Google Cloud project.

  7. Se você não ativar o faturamento do projeto do Google Cloud usado neste tutorial, consulte os dados públicos no sandbox do BigQuery. O sandbox do BigQuery ensina você a usar o BigQuery com um conjunto limitado de recursos sem custos financeiros.

  8. Verifique se a API BigQuery está ativada.

    Ativar a API

    Se você criou um novo projeto, a API BigQuery será ativada automaticamente.

  9. Conferir um conjunto de dados público

    Os conjuntos de dados públicos do BigQuery estão disponíveis por padrão no BigQuery Studio em um projeto chamado bigquery-public-data. Neste tutorial, você consulta o conjunto de dados de viagens do Citi Bike de Nova York. O Citi Bike é um grande programa de compartilhamento de bicicletas, com 10.000 bicicletas e 600 estações em Manhattan, Brooklyn, Queens e Jersey City. Esse conjunto de dados inclui as viagens do Citi Bike desde a inauguração em setembro de 2013.

    1. No console do Google Cloud , acesse a página BigQuery.

      Acessar o BigQuery

    2. No BigQuery Studio, no painel Explorador, clique em Adicionar dados.

    3. Na caixa de diálogo Adicionar dados, no painel Filtrar por, clique em Ícone do conjunto de dados público na página "Filtrar por" Conjuntos de dados públicos.

    4. Na página Marketplace, no campo Pesquisar no Marketplace, digite NYC Citi Bike Trips para restringir a pesquisa.

    5. Nos resultados da pesquisa, clique em NYC Citi Bike Trips.

    6. Na página Detalhes do produto, clique em Ver conjunto de dados. Na guia Detalhes, você encontra informações sobre o conjunto de dados.

    consulte um conjunto de dados público

    Nas etapas a seguir, você vai consultar a tabela citibike_trips para determinar as 100 estações do Citi Bike mais usadas no conjunto de dados público de viagens do Citi Bike de Nova York. A consulta recupera o nome e a localização da estação, além do número de viagens que começaram ali.

    A consulta usa a função ST_GEOGPOINT para criar um ponto com base nos parâmetros de longitude e latitude de cada estação e retorna esse ponto em uma coluna GEOGRAPHY. A coluna GEOGRAPHY é usada para gerar um mapa de calor no visualizador de dados geográficos integrado.

    1. No console do Google Cloud , abra a página do BigQuery.

      Acessar o BigQuery

    2. Clique em Consulta SQL.

    3. No editor de consultas, insira a seguinte consulta:

      SELECT
        start_station_name,
        start_station_latitude,
        start_station_longitude,
        ST_GEOGPOINT(start_station_longitude, start_station_latitude) AS geo_location,
        COUNT(*) AS num_trips
      FROM
        `bigquery-public-data.new_york.citibike_trips`
      GROUP BY
        1,
        2,
        3
      ORDER BY
        num_trips DESC
      LIMIT
        100;
      

      Se a consulta for válida, uma marca de seleção é exibida com a quantidade de dados que são processados pela consulta. Se a consulta for inválida, um ponto de exclamação é exibido com uma mensagem de erro.

      Validador de consulta

    4. Clique em Executar. As estações mais procuradas estão listadas na seção Resultados da consulta.

      Resultados da consulta no console Google Cloud

    5. Opcional: para exibir a duração do job e a quantidade de dados que o job de consulta processou, clique na guia Informações do job na seção Resultados da consulta.

    6. Mude para a guia Visualização. Essa guia gera um mapa para visualizar rapidamente seus resultados.

    7. No painel Configuração de visualização:

      1. Verifique se o Tipo de visualização está definido como Mapa.
      2. Verifique se a Coluna de geografia está definida como geo_location.
      3. Em Coluna de dados, escolha num_trips.
      4. Use a opção Aumentar zoom para mostrar o mapa de Manhattan.

      Um mapa de calor gerado na guia "Visualização"

    Limpar

    Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.

    Excluir o projeto

    Se você usou o sandbox do BigQuery para consultar o conjunto de dados público, o faturamento não está ativado para seu projeto, e você não precisa excluir o projeto.

    O jeito mais fácil de evitar cobranças é excluindo o projeto que você criou para o tutorial.

    Para excluir o projeto:

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    A seguir