Primeiros passos com análises geoespaciais


Neste tutorial, apresentamos a análise geoespacial. Com a análise geoespacial, você analisa e visualiza os dados geoespaciais no BigQuery.

Objetivos

Neste tutorial, você aprenderá a:

  • usar uma função de análise geoespacial para converter colunas de latitude e longitude em pontos geográficos;
  • executar uma consulta que encontre todas as estações do Citi Bike com mais de 30 bicicletas disponíveis para locação;
  • visualizar os resultados no BigQuery Geo Viz.

Custos

Neste tutorial, há componentes faturáveis do Google Cloud, incluindo o BigQuery:

Você será cobrado por:

Antes de começar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. O BigQuery é ativado automaticamente em novos projetos. Para ativá-lo em um projeto atual, acesse

    Enable the BigQuery API.

    Enable the API

Conferir os dados da amostra

Neste tutorial, usamos um conjunto de dados disponível por meio do programa de conjuntos de dados públicos do Google Cloud. Um conjunto de dados público é qualquer um que seja armazenado no BigQuery e disponibilizado ao público geral. Os conjuntos de dados públicos são hospedados no BigQuery para você acessar e integrar a seus aplicativos. O Google paga pelo armazenamento desses conjuntos de dados e oferece acesso público a eles por meio de um projeto. Você paga somente pelas consultas feitas aos dados. O primeiro terabyte (1 TB) por mês é gratuito, sujeito aos detalhes sobre preços de consultas.

Conjunto de dados de viagens do Citi Bike em Nova York

Viagens do Citi Bike em Nova York

O Citi Bike é o maior programa de compartilhamento de bicicletas dos Estados Unidos, com 10.000 bicicletas e 600 estações em Manhattan, Brooklyn, Queens e Jersey City. Neste conjunto de dados, constam as viagens do Ciki Bike desde a inauguração em setembro de 2013 e as atualizações diárias. Os dados são processados pelo Citi Bike para remover as viagens feitas por funcionários para manutenção e inspeção do sistema e de qualquer viagem abaixo de 60 segundos de duração, consideradas inválidas.

Para começar a examinar esses dados no console do BigQuery, veja os detalhes da tabela citibike_stations:

Acessar o esquema citibike_stations

Três colunas nesta tabela são relevantes para este tutorial:

  • bike_stations.longitude: a longitude de uma estação. Os valores são longitudes válidas em WGS 84 em formato de graus decimais.
  • bike_stations.latitude - a latitude de uma estação. Os valores são latitudes válidas em WGS 84 em formato de graus decimais.
  • num_bikes_available: o número de bicicletas disponíveis para locação.

Consultar as estações com mais de 30 bicicletas disponíveis

Nesta seção do tutorial, você executa uma consulta GoogleSQL que encontra todas as estações do Citi Bike na cidade de Nova York com mais de 30 bicicletas disponíveis para locação.

Detalhes da consulta

A consulta do GoogleSQL a seguir é usada para encontrar as estações do Citi Bike com mais de 30 bicicletas.

SELECT
  ST_GeogPoint(longitude, latitude)  AS WKT,
  num_bikes_available
FROM
  `bigquery-public-data.new_york.citibike_stations`
WHERE num_bikes_available > 30

A consulta inclui as seguintes cláusulas:

  • SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
    Por meio da cláusula SELECT, a coluna num_bikes_available é selecionada, e a função ST_GeogPoint é usada para converter os valores nas colunas latitude e longitude em tipos GEOGRAPHY (pontos).
  • FROM `bigquery-public-data.new_york.citibike_stations`
    A cláusula FROM especifica a tabela que está sendo consultada: citibike_stations.
  • WHERE num_bikes_available > 30
    Através da cláusula WHERE, são filtrados os valores na coluna num_bikes_available apenas para as estações com mais de 30 bicicletas.

Executar a consulta

Para executar a consulta usando o console do Google Cloud:

  1. Acesse a página do BigQuery no console do Google Cloud.

    Acesse a página do BigQuery

  2. Insira a seguinte consulta do GoogleSQL na área de texto do Editor de consultas.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Clique em Executar.

    A consulta leva um momento para ser concluída. Depois que ela é executada, os resultados são exibidos no painel Resultados da consulta.

    Resultados da consulta de estações de bicicleta

Visualizar os resultados da consulta no Geo Viz

Em seguida, visualize os resultados no BigQuery Geo Viz, uma ferramenta da Web para a visualização de dados geoespaciais do BigQuery com as APIs Google Maps.

Iniciar o Geo Viz e autenticar

Antes de usar o Geo Viz, é preciso autenticar e conceder acesso aos dados do Google BigQuery.

Para configurar o Geo Viz, siga estas etapas:

  1. Abra a ferramenta da Web do Geo Viz.

    Abrir a ferramenta da Web do Geo Viz

    Talvez seja necessário ativar os cookies para autorizar e usar essa ferramenta.

  2. Na primeira etapa, Consulta, clique em Autorizar.

    Botão de autorização do Geo Viz

  3. Na caixa de diálogo Escolher uma conta, clique na sua Conta do Google.

    Caixa de diálogo "Escolher uma conta"

  4. Na caixa de diálogo de acesso, clique em Permitir para conceder ao Geo Viz acesso aos dados do BigQuery.

    Caixa de diálogo "Permitir acesso"

Executar uma consulta GoogleSQL em dados geoespaciais

Depois de autenticar e conceder acesso, a próxima etapa é executar a consulta no Geo Viz.

Para executar a consulta, faça o seguinte:

  1. Na primeira etapa, Selecionar dados, insira o ID do projeto no campo ID do projeto.

  2. Na janela de consulta, insira esta consulta do GoogleSQL.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Clique em Executar.

  4. Quando a consulta for concluída, clique em Mostrar resultados. Como opção, clique na segunda etapa, Definir colunas.

    Ver os resultados

  5. Isso leva você à etapa dois. Nesta etapa, para a coluna Geometria, escolha WKT. Isso representa os pontos correspondentes às estações de bicicleta no seu mapa.

    Resultados mapeados

Formatar a visualização

Na seção "Estilo", há uma lista de estilos visuais para personalização. Determinadas propriedades se aplicam somente a tipos de dados específicos. Por exemplo, circleRadius afeta somente pontos.

Veja as properties de estilo compatíveis:

  • Cor de preenchimento. A cor de preenchimento de um polígono ou ponto. Por exemplo, as funções "linear" ou "intervalo" podem ser usadas para associar valores numéricos a um gradiente de cores.
  • Opacidade do preenchimento. A opacidade do preenchimento de um polígono ou ponto. Os valores precisam estar na faixa de 0 a 1, em que 0 = transparente e 1 = opaco.
  • strokeColor: a cor do traço ou contorno de um polígono ou de uma linha.
  • strokeOpacity. A opacidade do traço ou contorno do polígono ou da linha. Os valores precisam estar no intervalo de 0 a 1, em que 0 = transparente e 1 = opaco.
  • strokeWeight: a largura em pixels do traço ou contorno de um polígono ou de uma linha.
  • Raio do círculo. O raio do círculo que representa um ponto em pixels. Por exemplo, uma função "linear" pode ser usada para associar valores numéricos a tamanhos de ponto e criar um gráfico de dispersão.

Cada estilo pode receber um valor global, aplicado a todos os resultados, ou um valor orientado por dados, aplicado de maneiras diferentes dependendo dos dados de cada linha do resultado. Para valores orientados por dados, o resultado é determinado pelos seguintes elementos:

  • Função: uma função usada para calcular um valor de estilo a partir dos valores de um campo.
  • Identidade: o valor dos dados de cada campo é usado como o valor de estilo.
  • Categorização: os valores dos dados de cada campo listados no domínio são associados um a um aos estilos correspondentes da faixa.
  • Intervalo: os valores dos dados de cada campo são arredondados para o valor mais próximo no domínio, e o estilo correspondente da faixa é aplicado.
  • Linear: os valores dos dados de cada campo são interpolados linearmente entre os valores do domínio, e uma mistura dos estilos correspondentes da faixa é aplicada.
  • Campo: o campo especificado nos dados é usado como entrada para a função de estilo.
  • Domínio: uma lista ordenada de uma amostra dos valores de entrada de um campo. As entradas de amostra (domínio) são associadas a saídas de amostra (faixa) com base na função fornecida e são usadas para inferir valores de estilo para todas as entradas, mesmo as não listadas no domínio. Os valores no domínio precisam ser do mesmo tipo (texto, número etc.) dos valores do campo que você está visualizando.
  • range. Uma lista de uma amostra de valores de saída para a regra de estilo. Os valores da faixa precisam ser do mesmo tipo (cor ou número) da propriedade de estilo que você está controlando. Por exemplo, a faixa da propriedade fillColor precisa conter apenas cores.

Para formatar o mapa, siga estas etapas:

  1. Clique em Adicionar estilos na segunda etapa ou em Estilo, na terceira.

  2. Mude a cor dos pontos. Clique em fillColor.

  3. No campo Valor, insira #0000FF, que é o código HTML para a cor azul.

  4. Clique em Aplicar Estilo.

    Cor de preenchimento

  5. Examine o mapa. Se você clicar em um dos pontos, o valor será exibido.

    Datalhes dos pontos do mapa

  6. Clique em fillOpacity.

  7. No campo Value, digite 0.5 e clique em Apply Style.

    Opacidade do preenchimento

  8. Examine o mapa. A cor de preenchimento dos pontos agora está semitransparente.

    Mapa com pontos semitransparentes

  9. Altere o tamanho dos pontos com base no número de bicicletas disponíveis. Clique em circleRadius.

  10. No painel circleRadius, faça o seguinte:

    1. Clique em Baseado em dados.
    2. Em Função, escolha linear.
    3. Em Campo, escolha num_bikes_available.
    4. Em Domínio, insira 30 na primeira caixa e 60 na segunda.
    5. Em Faixa, insira 5 na primeira caixa e 20 na segunda.

      Raio do círculo

  11. Examine o mapa. O raio de cada círculo corresponde agora ao número de bicicletas disponíveis naquele local.

    Mapa final

  12. Feche o Geo Viz.

Limpeza

Para evitar cobranças na sua conta do Google Cloud pelos recursos usados no tutorial, exclua o projeto que os contém ou mantenha o projeto e exclua os recursos individuais.

  • exclua o projeto que você criou; ou
  • mantenha o projeto para uso futuro.

Para excluir o projeto:

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

A seguir