Neste tutorial, apresentamos a análise geoespacial. Com a análise geoespacial, você analisa e visualiza os dados geoespaciais no BigQuery.
Objetivos
Neste tutorial, você aprenderá a:
- usar uma função de análise geoespacial para converter colunas de latitude e longitude em pontos geográficos;
- executar uma consulta que encontre todas as estações do Citi Bike com mais de 30 bicicletas disponíveis para locação;
- visualizar os resultados no BigQuery Geo Viz.
Custos
Neste tutorial, há componentes faturáveis do Google Cloud, incluindo o BigQuery:
Você será cobrado por:
- Consulta aos dados nos conjuntos de dados públicos do BigQuery.
- Todo mês, o primeiro 1 TB será gratuito.
- Se você estiver usando preços baseados em capacidade, os custos da consulta serão incluídos no preço com base em capacidade.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
- O BigQuery é ativado automaticamente em novos projetos.
Para ativá-lo em um projeto atual, acesse
Enable the BigQuery API.
Conferir os dados da amostra
Neste tutorial, usamos um conjunto de dados disponível por meio do programa de conjuntos de dados públicos do Google Cloud. Um conjunto de dados público é qualquer um que seja armazenado no BigQuery e disponibilizado ao público geral. Os conjuntos de dados públicos são hospedados no BigQuery para você acessar e integrar a seus aplicativos. O Google paga pelo armazenamento. desses conjuntos de dados e fornece acesso público a eles usando uma projeto. Você paga somente pelas consultas feitas aos dados. O primeiro terabyte (1 TB) por mês é gratuito, sujeito aos detalhes sobre preços de consultas.
Conjunto de dados de viagens do Citi Bike em Nova York
Viagens do Citi Bike em Nova York
O Citi Bike é o maior programa de compartilhamento de bicicletas dos Estados Unidos, com 10.000 bicicletas e 600 estações em Manhattan, Brooklyn, Queens e Jersey City. Neste conjunto de dados, constam as viagens do Ciki Bike desde a inauguração em setembro de 2013 e as atualizações diárias. Os dados são processados pelo Citi Bike para remover viagens que estão feitos pela equipe para manutenção e inspeção do sistema e quaisquer viagens que sejam menos mais de 60 segundos, que são considerados inicializações falsas.
Para começar a examinar esses dados no console do BigQuery, veja os detalhes da tabela citibike_stations
:
Acessar o esquema citibike_stations
Três colunas nesta tabela são relevantes para este tutorial:
bike_stations.longitude
: a longitude de uma estação. Os valores são longitudes válidas em WGS 84 em formato de graus decimais.bike_stations.latitude
- a latitude de uma estação. Os valores são latitudes válidas em WGS 84 em formato de graus decimais.num_bikes_available
: o número de bicicletas disponíveis para locação.
Consultar as estações com mais de 30 bicicletas disponíveis
Nesta seção do tutorial, você executa uma consulta GoogleSQL que encontra todas as estações do Citi Bike na cidade de Nova York com mais de 30 bicicletas disponíveis para locação.
Detalhes da consulta
A consulta do GoogleSQL a seguir é usada para encontrar as estações do Citi Bike com mais de 30 bicicletas.
SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
A consulta inclui as seguintes cláusulas:
SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
- Por meio da cláusula
SELECT
, a colunanum_bikes_available
é selecionada, e a funçãoST_GeogPoint
é usada para converter os valores nas colunaslatitude
elongitude
em tiposGEOGRAPHY
(pontos).
FROM `bigquery-public-data.new_york.citibike_stations`
- A cláusula
FROM
especifica a tabela que está sendo consultada:citibike_stations
.
WHERE num_bikes_available > 30
- Através da cláusula
WHERE
, são filtrados os valores na colunanum_bikes_available
apenas para as estações com mais de 30 bicicletas.
Executar a consulta
Para executar a consulta usando o console do Google Cloud:
Acesse a página do BigQuery no console do Google Cloud.
Insira a seguinte consulta do GoogleSQL na área de texto do Editor de consultas.
-- Finds Citi Bike stations with > 30 bikes SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Clique em Executar.
A consulta leva um momento para ser concluída. Depois que ela é executada, os resultados são exibidos no painel Resultados da consulta.
Visualizar os resultados da consulta no Geo Viz
Em seguida, visualize os resultados no BigQuery Geo Viz, uma ferramenta da Web para a visualização de dados geoespaciais do BigQuery com as APIs Google Maps.
Iniciar o Geo Viz e autenticar
Antes de usar o Geo Viz, é preciso autenticar e conceder acesso aos dados do Google BigQuery.
Para configurar o Geo Viz, siga estas etapas:
Abra a ferramenta da Web do Geo Viz.
Abrir a ferramenta da Web do Geo Viz
Talvez seja necessário ativar os cookies para autorizar e usar essa ferramenta.
Na primeira etapa, Consulta, clique em Autorizar.
Na caixa de diálogo Escolher uma conta, clique na sua Conta do Google.
Na caixa de diálogo de acesso, clique em Permitir para conceder ao Geo Viz acesso aos dados do BigQuery.
Executar uma consulta GoogleSQL em dados geoespaciais
Depois de autenticar e conceder acesso, a próxima etapa é executar a consulta no Geo Viz.
Para executar a consulta, faça o seguinte:
Na primeira etapa, Selecionar dados, insira o ID do projeto no campo ID do projeto.
Na janela de consulta, insira esta consulta do GoogleSQL.
-- Finds Citi Bike stations with > 30 bikes SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Clique em Executar.
Quando a consulta for concluída, clique em Mostrar resultados. Como opção, clique na segunda etapa, Definir colunas.
Isso leva você à etapa dois. Nesta etapa, para a coluna Geometria, escolha WKT. Isso representa os pontos correspondentes às estações de bicicleta no seu mapa.
Formatar a visualização
Na seção "Estilo", há uma lista de estilos visuais para personalização. Determinadas propriedades se aplicam somente a tipos de dados específicos. Por exemplo, circleRadius
afeta somente pontos.
Veja as properties de estilo compatíveis:
- Cor de preenchimento. A cor de preenchimento de um polígono ou ponto. Por exemplo, as funções "linear" ou "intervalo" podem ser usadas para associar valores numéricos a um gradiente de cores.
- Opacidade do preenchimento. A opacidade do preenchimento de um polígono ou ponto. Os valores precisam estar na faixa de 0 a 1, em que
0
= transparente e1
= opaco. - strokeColor: a cor do traço ou contorno de um polígono ou de uma linha.
- strokeOpacity. A opacidade do traço ou contorno do polígono ou da linha.
Os valores precisam estar no intervalo de 0 a 1, em que
0
= transparente e1
= opaco. - strokeWeight: a largura em pixels do traço ou contorno de um polígono ou de uma linha.
- Raio do círculo. O raio do círculo que representa um ponto em pixels. Por exemplo, uma função "linear" pode ser usada para associar valores numéricos a tamanhos de ponto e criar um gráfico de dispersão.
Cada estilo pode receber um valor global, aplicado a todos os resultados, ou um valor orientado por dados, aplicado de maneiras diferentes dependendo dos dados de cada linha do resultado. Para valores orientados por dados, o resultado é determinado pelos seguintes elementos:
- Função: uma função usada para calcular um valor de estilo a partir dos valores de um campo.
- Identidade: o valor dos dados de cada campo é usado como o valor de estilo.
- Categorização: os valores dos dados de cada campo listados no domínio são associados um a um aos estilos correspondentes da faixa.
- Intervalo: os valores dos dados de cada campo são arredondados para o valor mais próximo no domínio, e o estilo correspondente da faixa é aplicado.
- Linear: os valores dos dados de cada campo são interpolados linearmente entre os valores do domínio, e uma mistura dos estilos correspondentes da faixa é aplicada.
- Campo: o campo especificado nos dados é usado como entrada para a função de estilo.
- Domínio: uma lista ordenada de uma amostra dos valores de entrada de um campo. As entradas de amostra (domínio) são associadas a saídas de amostra (faixa) com base na função fornecida e são usadas para inferir valores de estilo para todas as entradas, mesmo as não listadas no domínio. Os valores no domínio precisam ser do mesmo tipo (texto, número etc.) dos valores do campo que você está visualizando.
- range. Uma lista de uma amostra de valores de saída para a regra de estilo. Os valores da faixa precisam ser do mesmo tipo (cor ou número) da propriedade de estilo que você está controlando. Por exemplo, a faixa da propriedade
fillColor
precisa conter apenas cores.
Para formatar o mapa, siga estas etapas:
Clique em Adicionar estilos na segunda etapa ou em Estilo, na terceira.
Mude a cor dos pontos. Clique em fillColor.
No campo Valor, insira
#0000FF
, que é o código HTML para a cor azul.Clique em Aplicar Estilo.
Examine o mapa. Se você clicar em um dos pontos, o valor será exibido.
Clique em fillOpacity.
No campo Value, digite
0.5
e clique em Apply Style.Examine o mapa. A cor de preenchimento dos pontos agora está semitransparente.
Altere o tamanho dos pontos com base no número de bicicletas disponíveis. Clique em circleRadius.
No painel circleRadius, faça o seguinte:
- Clique em Baseado em dados.
- Em Função, escolha linear.
- Em Campo, escolha
num_bikes_available
. - Em Domínio, insira
30
na primeira caixa e60
na segunda. Em Faixa, insira
5
na primeira caixa e20
na segunda.
Examine o mapa. O raio de cada círculo corresponde agora ao número de bicicletas disponíveis naquele local.
Feche o Geo Viz.
Limpar
Para evitar cobranças na sua conta do Google Cloud pelos recursos usados no tutorial, exclua o projeto que os contém ou mantenha o projeto e exclua os recursos individuais.
- exclua o projeto que você criou; ou
- mantenha o projeto para uso futuro.
Para excluir o projeto:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
A seguir
- Para saber mais sobre as opções de visualização para análise geoespacial, consulte o artigo Como visualizar dados geoespaciais.
- Para saber mais sobre como trabalhar com dados de análises geoespaciais, consulte Como trabalhar com dados geoespaciais.
- Para ver um tutorial, consulte Como usar a análise geoespacial para traçar a rota de um furacão.
- Consulte a documentação sobre funções do GoogleSQL na análise geoespacial em Funções geográficas no GoogleSQL.