Inizia a utilizzare l'analisi geospaziale


Questo tutorial introduce l'analisi geospaziale. L'analisi geospaziale ti consente di analizzare e visualizzare i dati geospaziali in in BigQuery.

Obiettivi

In questo tutorial imparerai a:

  • Utilizzare una funzione di analisi geospaziale per convertire le colonne di latitudine e longitudine in punti geografici
  • Eseguire una query che trova tutte le stazioni Citi bike con più di 30 biciclette disponibile per il noleggio
  • Visualizza i risultati in BigQuery Geo Viz

Costi

Questo tutorial utilizza componenti fatturabili di Google Cloud, tra cui in BigQuery.

Ti vengono addebitati dei costi per:

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  6. BigQuery viene abilitato automaticamente nei nuovi progetti. Per attivare BigQuery in un progetto esistente, vai a

    Attiva l'API BigQuery.

    Abilita l'API

Esplora i dati di esempio

Questo tutorial utilizza un set di dati disponibile tramite Programma per i set di dati pubblici di Google Cloud. Per set di dati pubblico si intende qualsiasi set di dati archiviato in BigQuery rese disponibili al pubblico. La I set di dati pubblici sono quelli che BigQuery ospita per l'accesso e l'integrazione nelle applicazioni. Google paga lo spazio di archiviazione di questi set di dati e fornisce l'accesso pubblico ai dati utilizzando progetto. Paghi solo per le query che che utilizzi sui dati (il primo TB al mese è gratuito, in base alle dettagli sui prezzi delle query.)

Il set di dati delle Citi Bike Trips di NYC

Viaggi in Citi bike a New York

Citi bike è il più grande programma di bike sharing della nazione, con 10.000 biciclette e 600 stazione in Manhattan, Brooklyn, Queens e Jersey City. Questo set di dati include gli itinerari di Citi Cyclette dal lancio di Citi Cyclette nel settembre 2013 ed è aggiornate quotidianamente. I dati vengono elaborati da Citi Cyclette per rimuovere le corse che vengono effettuati dal personale per riparare e ispezionare il sistema e gli eventuali viaggi di minor entità di una durata superiore a 60 secondi, considerati falsi avvii.

Puoi iniziare a esplorare questi dati nella console BigQuery visualizzazione dei dettagli della tabella citibike_stations:

Vai allo schema citibike_stations

Tre colonne in questa tabella sono pertinenti per questo tutorial:

  • bike_stations.longitude: la longitudine di una stazione. I valori sono longitudini WGS 84 in formato decimale valido.
  • bike_stations.latitude: la latitudine di una stazione. I valori sono per le latitudini WGS 84 in formato decimale.
  • num_bikes_available: il numero di biciclette disponibili per il noleggio.

Eseguire query sulle stazioni di noleggio delle biciclette con più di 30 biciclette disponibili

In questa sezione del tutorial, eseguirai una query GoogleSQL che trova tutti i Stazioni Citi bike a New York con oltre 30 biciclette disponibili per il noleggio.

Dettagli query

La seguente query GoogleSQL viene utilizzata per trovare le stazioni Citi bike con più di 30 biciclette.

SELECT
  ST_GeogPoint(longitude, latitude)  AS WKT,
  num_bikes_available
FROM
  `bigquery-public-data.new_york.citibike_stations`
WHERE num_bikes_available > 30

Le clausole di query:

  • SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
    La clausola SELECT seleziona la colonna num_bikes_available e utilizza la ST_GeogPoint per convertire i valori in latitude e longitude colonne a tipi GEOGRAPHY (punti).
  • FROM `bigquery-public-data.new_york.citibike_stations`
    La clausola FROM specifica la tabella su cui viene eseguita la query: citibike_stations.
  • WHERE num_bikes_available > 30
    La clausola WHERE filtra i valori nella colonna num_bikes_available per solo le stazioni con più di 30 biciclette.

Esegui la query

Per eseguire la query utilizzando la console Google Cloud:

  1. Vai alla pagina BigQuery nella console Google Cloud.

    Vai alla pagina di BigQuery

  2. Inserisci la seguente query GoogleSQL nell'area di testo Editor query.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Fai clic su Esegui.

    Il completamento della query richiede alcuni istanti. Dopo l'esecuzione della query, i risultati vengono visualizzati nel riquadro Risultati delle query.

    Risultati della query relativa alle stazioni di noleggio.

Visualizza i risultati della query in Visualizzazione geografica

Successivamente, visualizzerai i risultati utilizzando BigQuery Geo Viz: strumento web per la visualizzazione di dati geospaziali in BigQuery utilizzando API di Google Maps.

Avvia Geo Viz ed autentica

Prima di utilizzare la visualizzazione geografica, devi eseguire l'autenticazione e concedere l'accesso ai dati in in BigQuery.

Per impostare la visualizzazione geografica:

  1. Apri lo strumento web Visualizzazione geografica.

    Apri lo strumento web Geo Viz

    Potrebbe essere necessario abilitare i cookie per autorizzare e utilizzare questo strumento.

  2. Nel primo passaggio, Query, fai clic su Autorizza.

    Pulsante di autorizzazione per la visualizzazione geografica.

  3. Nella finestra di dialogo Scegli un account, fai clic sul tuo Account Google.

    Finestra di dialogo Scegli account.

  4. Nella finestra di dialogo di accesso, fai clic su Consenti per autorizzare Geo Viz ad accedere al tuo Dati BigQuery.

    Finestra di dialogo Consenti accesso.

Eseguire una query GoogleSQL su dati geospaziali

Dopo aver autenticato e concesso l'accesso, il passaggio successivo è eseguire la query in Visualizzazione geografica

Per eseguire la query:

  1. Nel primo passaggio, Seleziona dati, inserisci il tuo ID progetto nel campo ID progetto .

  2. Nella finestra della query, inserisci la seguente query GoogleSQL.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Fai clic su Esegui.

  4. Al termine della query, fai clic su Mostra risultati. Puoi anche fare clic sul secondo passaggio Definisci le colonne.

    Visualizza i risultati.

  5. In questo modo passi al secondo passaggio. Nel secondo passaggio, per Colonna Geometria, scegli WKT Vengono rappresentati i punti corrispondenti alle stazioni di noleggio delle biciclette mappa.

    Risultati mappati.

Formattare la visualizzazione

La sezione Stile fornisce un elenco di stili visivi disponibili per la personalizzazione. Determinati si applicano solo a certi tipi di dati. Ad esempio, circleRadius influisce solo sui punti.

Le proprietà degli stili supportate includono:

  • fillColor. Il colore di riempimento di un poligono o di un punto. Ad esempio: "lineare" o "intervallo" può essere usato per mappare valori numerici a un colore gradiente.
  • fillOpacity. L'opacità di riempimento di un poligono o di un punto. I valori devono essere compresa nell'intervallo da 0 a 1, dove 0 = trasparente e 1 = opaco.
  • strokeColor. Il colore del tratto o dei contorni di un poligono o di una linea.
  • strokeOpacity. L'opacità del tratto o del contorno del poligono o della linea. I valori devono essere compresi tra 0 e 1, dove 0 = trasparente e 1 = opaco.
  • strokeWeight. Lo spessore del tratto o dei contorni in pixel di un poligono o dalla riga di comando.
  • circleRadius. Il raggio del cerchio che rappresenta un punto in pixel. Ad esempio, una stringa "lineare" può essere utilizzata per mappare valori numerici alle dimensioni dei punti per creare uno stile di grafico a dispersione.

A ogni stile può essere assegnato un valore globale (applicato a ogni risultato) o un valore basato sui dati (applicato in modi diversi a seconda dei dati di ciascun risultato riga). Per i valori basati sui dati, vengono utilizzati i seguenti elementi per determinare il risultato:

  • funzione. Una funzione utilizzata per calcolare un valore di stile dal e i relativi valori.
  • identity. Il valore dei dati di ciascun campo viene utilizzato come stile valore.
  • categorical. I valori dei dati di ogni campo elencato nel dominio sono mappate da uno a uno con gli stili corrispondenti nell'intervallo.
  • interval. I valori dei dati di ogni campo vengono arrotondati per difetto al più vicino nel dominio, a cui poi assegnare gli stili con lo stile corrispondente intervallo.
  • lineare. I valori dei dati di ogni campo sono interpolati linearmente nel dominio, a cui poi viene applicata una combinazione dei stili nell'intervallo.
  • . Il campo specificato nei dati viene utilizzato come input per la funzione di stile.
  • dominio. Un elenco ordinato di valori di input di esempio da un campo. Anteprima (dominio) sono accoppiati a output di esempio (intervallo) in base al parametro e vengono utilizzati per dedurre valori di stile per tutti gli input (anche quelli non elencato nel dominio). I valori nel dominio devono essere dello stesso tipo (testo, numero e così via) come valori del campo che stai visualizzando.
  • intervallo. Un elenco di valori di output di esempio per la regola di stile. Valori in l'intervallo deve avere lo stesso tipo (colore o numero) della proprietà di stile che controllate. Ad esempio, l'intervallo della proprietà fillColor deve che contengono solo colori.

Per formattare la mappa:

  1. Fai clic su Aggiungi stili nel secondo passaggio o fai clic sul passaggio 3 Stile.

  2. Modifica il colore dei punti. Fai clic su fillColor.

  3. Nel campo Valore, inserisci #0000FF, il codice colore HTML del blu.

  4. Fai clic su Applica stile.

    Colore riempimento.

  5. Esamina la mappa. Se fai clic su uno dei punti, viene visualizzato il valore.

    Dettagli dei punti sulla mappa.

  6. Fai clic su fillOpacity.

  7. Nel campo Valore, inserisci 0.5 e fai clic su Applica stile.

    Riempi l'opacità.

  8. Esamina la mappa. Il colore di riempimento dei punti è ora semitrasparente.

    Mappa con punti semitrasparenti.

  9. Modifica le dimensioni dei punti in base al numero di biciclette disponibili. Clic circleRadius.

  10. Nel riquadro circleRadius:

    1. Fai clic su Basato sui dati.
    2. In corrispondenza di Funzione, scegli Lineare.
    3. In corrispondenza di Campo, scegli num_bikes_available.
    4. In Dominio, inserisci 30 nella prima casella e 60 nel secondo.
    5. Per Intervallo, inserisci 5 nella prima casella e 20 nella seconda.

      Raggio del cerchio.

  11. Esamina la mappa. Il raggio di ogni cerchio ora corrisponde al numero di biciclette disponibili in quella posizione.

    Mappa finale.

  12. Chiudi la visualizzazione geografica

Esegui la pulizia

Per evitare che al tuo Account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.

  • Puoi eliminare il progetto che hai creato.
  • In alternativa, puoi conservare il progetto per un uso futuro.

Per eliminare il progetto:

  1. Nella console Google Cloud, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.

Passaggi successivi