Questo tutorial introduce l'analisi geospaziale. Le analisi geospaziali ti consentono di analizzare e visualizzare i dati geospaziali in BigQuery.
Obiettivi
In questo tutorial imparerai a:
- Utilizzare una funzione di analisi geospaziale per convertire le colonne di latitudine e longitudine in punti geografici
- Eseguire una query che trova tutte le stazioni Citi bike con più di 30 biciclette disponibile per il noleggio
- Visualizza i risultati in BigQuery Geo Viz
Costi
Questo tutorial utilizza componenti fatturabili di Google Cloud, tra cui in BigQuery.
Ti vengono addebitati costi per:
- Eseguire query sui dati nei set di dati pubblici di BigQuery.
- Il primo terabyte al mese è gratuito.
- Se utilizzi i prezzi basati sulla capacità, i costi delle query sono inclusi nel prezzo basato sulla capacità.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
- BigQuery viene attivato automaticamente nei nuovi progetti.
Per attivare BigQuery in un progetto esistente, vai a
Enable the BigQuery API.
Esplora i dati di esempio
Questo tutorial utilizza un set di dati disponibile tramite il programma per i set di dati pubblici di Google Cloud. Per set di dati pubblico si intende qualsiasi set di dati archiviato in BigQuery rese disponibili al pubblico. I set di dati pubblici sono set di dati ospitati da BigQuery per consentirti di accedervi e integrarli nelle tue applicazioni. Google paga lo spazio di archiviazione di questi set di dati e fornisce l'accesso pubblico ai dati utilizzando progetto. Paghi solo per le query che che utilizzi sui dati (il primo TB al mese è gratuito, in base alle dettagli sui prezzi delle query.)
Il set di dati delle Citi Bike Trips di NYC
Viaggi in Citi bike a New York
Citi bike è il più grande programma di bike sharing della nazione, con 10.000 biciclette e 600 stazione in Manhattan, Brooklyn, Queens e Jersey City. Questo set di dati include gli itinerari di Citi Cyclette dal lancio di Citi bike a settembre 2013 ed è aggiornate quotidianamente. I dati vengono elaborati da Citi Bike per rimuovere i viaggi effettuati dal personale per la manutenzione e l'ispezione del sistema, nonché i viaggi di durata inferiore a 60 secondi, che sono considerati falsi avvii.
Puoi iniziare a esplorare questi dati nella console BigQuery visualizzando i dettagli della tabella citibike_stations
:
Vai allo schema citibike_stations
Tre colonne di questa tabella sono pertinenti per questo tutorial:
bike_stations.longitude
: la longitudine di una stazione. I valori sono longitudini WGS 84 in formato decimale valido.bike_stations.latitude
: la latitudine di una stazione. I valori sono per le latitudini WGS 84 in formato decimale.num_bikes_available
: il numero di biciclette disponibili per il noleggio.
Eseguire query sulle stazioni di noleggio delle biciclette con più di 30 biciclette disponibili
In questa sezione del tutorial, eseguirai una query GoogleSQL che trova tutti i Stazioni Citi bike a New York con oltre 30 biciclette disponibili per il noleggio.
Dettagli query
La seguente query GoogleSQL viene utilizzata per trovare le stazioni Citi Bike con più di 30 biciclette.
SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Le clausole di query eseguono le seguenti operazioni:
SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
- La clausola
SELECT
seleziona la colonnanum_bikes_available
e utilizza laST_GeogPoint
per convertire i valori inlatitude
elongitude
colonne a tipiGEOGRAPHY
(punti).
FROM `bigquery-public-data.new_york.citibike_stations`
- La clausola
FROM
specifica la tabella su cui viene eseguita la query:citibike_stations
.
WHERE num_bikes_available > 30
- La clausola
WHERE
filtra i valori nella colonnanum_bikes_available
per solo le stazioni con più di 30 biciclette.
Esegui la query
Per eseguire la query utilizzando la console Google Cloud:
Vai alla pagina BigQuery nella console Google Cloud.
Inserisci la seguente query GoogleSQL nell'area di testo Editor query.
-- Finds Citi Bike stations with > 30 bikes SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Fai clic su Esegui.
Il completamento della query richiede un istante. Dopo l'esecuzione della query, i risultati vengono visualizzati nel riquadro Risultati delle query.
Visualizzare i risultati della query in Geo Viz
Successivamente, visualizzi i risultati utilizzando BigQuery Geo Viz: uno strumento web per la visualizzazione dei dati geospaziali in BigQuery utilizzando le API di Google Maps.
Avvia Geo Viz ed esegui l'autenticazione
Prima di utilizzare Geo Viz, devi autenticarti e concedere l'accesso ai dati in BigQuery.
Per impostare la visualizzazione geografica:
Apri lo strumento web Visualizzazione geografica.
Potrebbe essere necessario abilitare i cookie per autorizzare e utilizzare questo strumento.
Nel passaggio 1, Query, fai clic su Autorizza.
Nella finestra di dialogo Scegli un account, fai clic sul tuo Account Google.
Nella finestra di dialogo di accesso, fai clic su Consenti per autorizzare Geo Viz ad accedere al tuo Dati BigQuery.
Eseguire una query GoogleSQL su dati geospaziali
Dopo aver autenticato e concesso l'accesso, il passaggio successivo è eseguire la query in Visualizzazione geografica
Per eseguire la query:
Per il primo passaggio, Seleziona dati, inserisci il tuo ID progetto nel campo ID progetto.
Nella finestra della query, inserisci la seguente query GoogleSQL.
-- Finds Citi Bike stations with > 30 bikes SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Fai clic su Esegui.
Al termine della query, fai clic su Mostra risultati. Puoi anche fare clic sul secondo passaggio Definisci le colonne.
In questo modo passi al secondo passaggio. Nel secondo passaggio, per Colonna Geometria, scegli WKT Vengono rappresentati i punti corrispondenti alle stazioni di noleggio delle biciclette sul mappa.
Formattare la visualizzazione
La sezione Stile fornisce un elenco di stili visivi disponibili per la personalizzazione. Alcune proprietà si applicano solo a determinati tipi di dati. Ad esempio, circleRadius
influisce solo sui punti.
Le proprietà degli stili supportate includono:
- fillColor. Il colore di riempimento di un poligono o di un punto. Ad esempio: "lineare" o "intervallo" può essere usato per mappare valori numerici a un colore gradiente.
- fillOpacity. L'opacità del riempimento di un poligono o di un punto. I valori devono essere
in un intervallo compreso tra 0 e 1, dove
0
= trasparente e1
= opaco. - strokeColor. Il colore del tratto o del contorno di un poligono o di una linea.
- strokeOpacity. L'opacità del tratto o del contorno del poligono o della linea.
I valori devono essere compresi tra 0 e 1, dove
0
= trasparente e1
= opaco. - strokeWeight. La larghezza del tratto o del contorno in pixel di un poligono o di una linea.
- circleRadius. Il raggio del cerchio che rappresenta un punto in pixel. Ad esempio, una funzione "lineare" può essere utilizzata per mappare i valori numerici alle dimensioni dei punti per creare uno stile di grafico a dispersione.
A ogni stile può essere assegnato un valore globale (applicato a ogni risultato) o un valore basato sui dati (applicato in modi diversi a seconda dei dati in ogni riga del risultato). Per i valori basati sui dati, per determinare il risultato vengono utilizzati i seguenti elementi:
- funzione. Una funzione utilizzata per calcolare un valore dello stile dai valori di un campo.
- identity. Il valore dei dati di ciascun campo viene utilizzato come stile valore.
- categoria. I valori dei dati di ogni campo elencato nel dominio sono mappate da uno a uno con gli stili corrispondenti nell'intervallo.
- interval. I valori dei dati di ogni campo vengono arrotondati per difetto al valore più vicino nel dominio e poi formattati con lo stile corrispondente nell'intervallo.
- linear. I valori dei dati di ogni campo vengono interpolati linearmente nel dominio, a cui poi viene applicata una combinazione dei stili nell'intervallo.
- . Il campo specificato nei dati viene utilizzato come input per la funzione di stile.
- domain. Un elenco ordinato di valori di input di esempio di un campo. Anteprima (dominio) vengono associati a output di esempio (intervallo) in base al parametro e vengono utilizzati per dedurre valori di stile per tutti gli input (anche quelli non elencati nel dominio). I valori nel dominio devono essere dello stesso tipo (testo, numero e così via) come valori del campo che stai visualizzando.
- intervallo. Un elenco di valori di output di esempio per la regola di stile. Valori in
l'intervallo deve avere lo stesso tipo (colore o numero) della proprietà di stile che
controllate. Ad esempio, l'intervallo della proprietà
fillColor
deve contenere solo colori.
Per formattare la mappa:
Fai clic su Aggiungi stili nel secondo passaggio o fai clic sul passaggio 3 Stile.
Modifica il colore dei punti. Fai clic su fillColor.
Nel campo Valore, inserisci
#0000FF
, il codice colore HTML del blu.Fai clic su Applica stile.
Esamina la mappa. Se fai clic su uno dei punti, viene visualizzato il valore.
Fai clic su fillOpacity.
Nel campo Valore, inserisci
0.5
e fai clic su Applica stile.Esamina la mappa. Il colore di riempimento dei punti è ora semitrasparente.
Modifica le dimensioni dei punti in base al numero di biciclette disponibili. Fai clic su circleRadius.
Nel riquadro circleRadius:
- Fai clic su Basato sui dati.
- In corrispondenza di Funzione, scegli Lineare.
- In Campo, scegli
num_bikes_available
. - Per Dominio, inserisci
30
nella prima casella e60
nel secondo. In Intervallo, inserisci
5
nella prima casella e20
nella seconda.
Esamina la mappa. Il raggio di ogni cerchio ora corrisponde al numero di biciclette disponibili in quella posizione.
Chiudi Geo Viz.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
- Puoi eliminare il progetto che hai creato.
- In alternativa, puoi conservare il progetto per un uso futuro.
Per eliminare il progetto:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Passaggi successivi
- Per scoprire di più sulle opzioni di visualizzazione per l'analisi geospaziale, consulta Visualizzazione dei dati geospaziali.
- Per scoprire di più sull'utilizzo dei dati di analisi geospaziali, consulta Utilizzare i dati geospaziali.
- Per un tutorial sull'utilizzo dell'analisi geospaziale, consulta Utilizzare l'analisi geospaziale per tracciare il percorso di un uragano.
- Per la documentazione sulle funzioni GoogleSQL nell'analisi geospaziale, vedi Funzioni geografiche in GoogleSQL.