Inizia a utilizzare l'analisi geospaziale


Questo tutorial illustra l'analisi geospaziale. L'analisi geospaziale consente di analizzare e visualizzare i dati geospaziali in BigQuery.

Obiettivi

In questo tutorial:

  • Usa una funzione di analisi geospaziale per convertire le colonne di latitudine e longitudine in punti geografici
  • Esegui una query che trovi tutte le stazioni di Citi Bike con oltre 30 biciclette disponibili per il noleggio
  • Visualizza i risultati in Visualizzazione geografica di BigQuery

Costi

Questo tutorial utilizza i componenti fatturabili di Google Cloud, tra cui BigQuery.

Ti vengono addebitati i seguenti costi:

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  4. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  5. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  6. BigQuery viene abilitato automaticamente nei nuovi progetti. Per attivare BigQuery in un progetto esistente, vai a

    Attiva l'API BigQuery.

    Abilita l'API

Esplora i dati di esempio

Questo tutorial utilizza un set di dati disponibile tramite il programma per set di dati pubblici di Google Cloud. Per set di dati pubblico si intende qualsiasi set di dati archiviato in BigQuery e reso disponibile al pubblico. I set di dati pubblici sono set di dati che BigQuery ospita per consentirti di accedere e integrarli nelle tue applicazioni. Google paga l'archiviazione di questi set di dati e fornisce l'accesso pubblico ai dati tramite un progetto. Paghi solo per le query eseguite sui dati (il primo TB al mese è gratuito, in base ai dettagli dei prezzi delle query).

Il set di dati NYC Citi Bike Trips

Viaggi Citi Bike a New York

Citi Bike è il più grande programma di bike sharing della nazione, con 10.000 biciclette e 600 stazioni tra Manhattan, Brooklyn, Queens e Jersey City. Questo set di dati include le corse Citi Bike dal lancio di Citi Bike a settembre 2013 e viene aggiornato quotidianamente. I dati vengono elaborati da Citi Bike per rimuovere le corse effettuate dal personale per gestire e ispezionare il sistema, nonché eventuali corse di durata inferiore a 60 secondi, che sono considerate false partenze.

Puoi iniziare a esplorare questi dati nella console BigQuery visualizzando i dettagli della tabella citibike_stations:

Vai allo schema citibike_stations

Tre colonne di questa tabella sono pertinenti per questo tutorial:

  • bike_stations.longitude: la longitudine di una stazione. I valori sono longitudini WGS 84 valide in formato decimale.
  • bike_stations.latitude: la latitudine di una stazione. I valori sono latitudini WGS 84 validi in formato gradi decimali.
  • num_bikes_available: il numero di biciclette disponibili per il noleggio.

Interroga le stazioni per biciclette con più di 30 biciclette disponibili

In questa sezione del tutorial esegui una query GoogleSQL che trova tutte le stazioni di Citi Bike a New York City con più di 30 biciclette disponibili per il noleggio.

Dettagli query

La seguente query GoogleSQL viene utilizzata per trovare le stazioni di Citi Bike con più di 30 biciclette.

SELECT
  ST_GeogPoint(longitude, latitude)  AS WKT,
  num_bikes_available
FROM
  `bigquery-public-data.new_york.citibike_stations`
WHERE num_bikes_available > 30

Le clausole di query:

  • SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
    La clausola SELECT seleziona la colonna num_bikes_available e utilizza la funzione ST_GeogPoint per convertire i valori nelle colonne latitude e longitude in tipi GEOGRAPHY (punti).
  • FROM `bigquery-public-data.new_york.citibike_stations`
    La clausola FROM specifica la tabella su cui viene eseguita la query: citibike_stations.
  • WHERE num_bikes_available > 30
    La clausola WHERE filtra i valori nella colonna num_bikes_available solo per le stazioni con più di 30 biciclette.

Eseguire la query

Per eseguire la query utilizzando la console Google Cloud:

  1. Vai alla pagina BigQuery nella console Google Cloud.

    Vai alla pagina BigQuery

  2. Inserisci la seguente query GoogleSQL nell'area di testo Editor query.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Fai clic su Esegui.

    Il completamento della query richiede alcuni istanti. Dopo l'esecuzione della query, i risultati vengono visualizzati nel riquadro Risultati query.

    Risultati della query relativa alla stazione di bike sharing.

Visualizzare i risultati della query in visualizzazione geografica

Successivamente, potrai visualizzare i risultati utilizzando BigQuery Geo Viz, uno strumento web per la visualizzazione dei dati geospaziali in BigQuery mediante le API di Google Maps.

Avvia la visualizzazione geografica ed esegui l'autenticazione

Prima di utilizzare Geo Viz, devi autenticarti e concedere l'accesso ai dati in BigQuery.

Per configurare la visualizzazione geografica:

  1. Apri lo strumento web Geo Viz.

    Apri lo strumento web Geo Viz

    Potrebbe essere necessario attivare i cookie per autorizzare e utilizzare questo strumento.

  2. Nel primo passaggio, Query, fai clic su Autorizza.

    Pulsante di autorizzazione Geo Viz.

  3. Nella finestra di dialogo Scegli un account, fai clic sul tuo Account Google.

    Finestra di dialogo Scegli account.

  4. Nella finestra di dialogo di accesso, fai clic su Consenti per concedere alla visualizzazione geografica l'accesso ai tuoi dati BigQuery.

    Finestra di dialogo Consenti accesso.

Eseguire una query GoogleSQL sui dati geospaziali

Dopo aver eseguito l'autenticazione e concesso l'accesso, il passaggio successivo consiste nell'eseguire la query in Geo Viz.

Per eseguire la query:

  1. Per il passaggio 1, Seleziona dati, inserisci l'ID progetto nel campo ID progetto.

  2. Nella finestra della query, inserisci la seguente query GoogleSQL.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Fai clic su Esegui.

  4. Al termine della query, fai clic su Mostra risultati. Puoi anche fare clic sul passaggio due Definisci colonne.

    Visualizza i risultati.

  5. Questo ti porta al passaggio due. Nel secondo passaggio, per Colonna Geometria, scegli WKT. Indica i punti corrispondenti alle stazioni di bike sharing sulla mappa.

    Risultati mappati.

Formattare la visualizzazione

La sezione Stile fornisce un elenco di stili visivi da personalizzare. Alcune proprietà si applicano solo a determinati tipi di dati. Ad esempio, circleRadius riguarda solo i punti.

Le proprietà degli stili supportate includono:

  • fillColor. Il colore di riempimento di un poligono o di un punto. Ad esempio, è possibile utilizzare le funzioni "lineare" o "intervallo" per mappare valori numerici a un gradiente di colore.
  • fillOpacity. L'opacità di riempimento di un poligono o di un punto. I valori devono essere compresi tra 0 e 1, dove 0 = trasparente e 1 = opaco.
  • strokeColor. Il colore del tratto o del contorno di un poligono o di una linea.
  • strokeOpacity. L'opacità del tratto o del contorno del poligono o della linea. I valori devono essere compresi tra 0 e 1, dove 0 = trasparente e 1 = opaco.
  • strokeWeight. Lo spessore del tratto o del contorno in pixel di un poligono o di una linea.
  • circleRadius. Il raggio del cerchio che rappresenta un punto in pixel. Ad esempio, una funzione "lineare" può essere utilizzata per mappare valori numerici alle dimensioni in punti e creare uno stile di grafico a dispersione.

A ogni stile è possibile assegnare un valore globale (applicato a ogni risultato) o un valore basato sui dati (applicato in modi diversi a seconda dei dati in ogni riga dei risultati). Per i valori basati sui dati, vengono utilizzati i seguenti valori per determinare il risultato:

  • funzione. Una funzione utilizzata per calcolare un valore di stile dai valori di un campo.
  • identity. Il valore dei dati di ogni campo viene utilizzato come valore di stile.
  • categorical. I valori dei dati di ogni campo elencato nel dominio vengono mappati uno a uno con gli stili corrispondenti nell'intervallo.
  • intervallo. I valori dei dati di ogni campo vengono arrotondati per difetto al valore più vicino nel dominio e vengono definiti con lo stile corrispondente nell'intervallo.
  • lineare. I valori dei dati di ciascun campo vengono interpolati in modo lineare tra i valori del dominio e vengono definiti con una combinazione degli stili corrispondenti nell'intervallo.
  • . Il campo specificato nei dati viene utilizzato come input per la funzione di stile.
  • dominio. Un elenco ordinato di valori di input di esempio di un campo. Gli input di esempio (dominio) sono abbinati a output di esempio (intervallo) in base alla funzione specificata e vengono utilizzati per dedurre i valori di stile per tutti gli input (anche quelli non elencati nel dominio). I valori nel dominio devono avere lo stesso tipo (testo, numero e così via) dei valori del campo che stai visualizzando.
  • intervallo. Un elenco di valori di output di esempio per la regola di stile. I valori nell'intervallo devono avere lo stesso tipo (colore o numero) della proprietà di stile che stai controllando. Ad esempio, l'intervallo della proprietà fillColor deve contenere solo colori.

Per formattare la mappa:

  1. Fai clic su Aggiungi stili nel secondo passaggio oppure fai clic sul passaggio 3 Stile.

  2. Modifica il colore dei punti. Fai clic su fillColor.

  3. Nel campo Valore, inserisci #0000FF, il codice colore HTML del blu.

  4. Fai clic su Applica stile.

    Colore riempimento.

  5. Esamina la mappa. Se fai clic su uno dei punti, viene visualizzato il valore.

    Dettagli dei punti sulla mappa.

  6. Fai clic su fillOpacity.

  7. Nel campo Valore, inserisci 0.5 e fai clic su Applica stile.

    Opacità riempimento.

  8. Esamina la mappa. Il colore di riempimento dei punti è ora semitrasparente.

    Mappa con punti semitrasparenti.

  9. Modifica la dimensione dei punti in base al numero di biciclette disponibili. Fai clic su circleRadius.

  10. Nel riquadro circleRadius:

    1. Fai clic su Basato sui dati.
    2. Per Funzione, scegli Lineare.
    3. In Campo, scegli num_bikes_available.
    4. In Dominio, inserisci 30 nella prima casella e 60 nella seconda.
    5. In Intervallo, inserisci 5 nella prima casella e 20 nella seconda.

      Raggio del cerchio.

  11. Esamina la mappa. Il raggio di ogni cerchio ora corrisponde al numero di biciclette disponibili in quella località.

    Mappa finale.

  12. Chiudi la visualizzazione geografica.

Esegui la pulizia

Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.

  • Puoi eliminare il progetto che hai creato.
  • In alternativa, puoi conservare il progetto per utilizzarlo in futuro.

Per eliminare il progetto:

  1. Nella console Google Cloud, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.

Passaggi successivi