In dieser Anleitung lernen Sie raumbezogene Analysen kennen. Mit raumbezogenen Analysen können Sie raumbezogene Daten in BigQuery analysieren und visualisieren.
Ziele
In dieser Anleitung erwartet Sie Folgendes:
- Verwenden Sie eine raumbezogene Analysefunktion, um Breiten- und Längengradspalten in geografische Punkte umzuwandeln
- Eine Abfrage ausführen, mit der alle Citi Bike-Stationen mit mehr als 30 verfügbaren Leihfahrrädern ermittelt werden
- Ihre Ergebnisse in BigQuery Geo Viz visualisieren.
Kosten
In dieser Anleitung werden kostenpflichtige Komponenten von Google Cloud verwendet, darunter auch BigQuery.
Kostenpflichtig sind:
- Abfragen von Daten in den öffentlichen BigQuery-Datasets
- Die ersten 1 TB pro Monat sind kostenlos
- Wenn Sie kapazitätsbasierte Preise verwenden, sind die Abfragekosten im kapazitätsbasierten Preis enthalten.
Vorbereitung
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
- BigQuery ist in neuen Projekten automatisch aktiviert.
Öffnen Sie zum Aktivieren von BigQuery in einem bestehenden Projekt
Enable the BigQuery API.
.
Beispieldaten prüfen
In dieser Anleitung wird ein Dataset aus dem Google Cloud Public Dataset-Programm verwendet. Ein öffentliches Dataset ist ein Dataset, das in BigQuery gespeichert ist und der Allgemeinheit zugänglich gemacht wird. Die öffentlichen Datasets werden für Sie von BigQuery gehostet, damit Sie auf sie zugreifen und sie in Ihre Anwendungen integrieren können. Google bezahlt die Speicherung dieser Datasets und bietet einen öffentlichen Zugriff auf die Daten über ein Projekt. Sie bezahlen nur für die Abfrage der Daten. Die ersten 1 TB pro Monat sind kostenlos. Weitere Informationen erhalten Sie unter Details der Abfragepreise.
Dataset "NYC Citi Bike Trips"
Citi Bike ist das größte Fahrradverleihprogramm der USA mit 10.000 Fahrrädern und 600 Stationen in Manhattan, Brooklyn, Queens und Jersey City. Dieses Dataset enthält Citi Bike-Fahrten seit der Einführung von Citi Bike im September 2013 und wird täglich aktualisiert. Die Daten werden von Citi Bike verarbeitet, um Personalfahrten zur Wartung und Inspektion der Anlage sowie Fahrten von weniger als 60 Sekunden, die als Fehlstart betrachtet werden, zu entfernen.
Sie können sich diese Daten in der BigQuery-Konsole genauer ansehen und dafür die Details der Tabelle citibike_stations
aufrufen:
Für diese Anleitung sind drei Spalten in dieser Tabelle relevant:
bike_stations.longitude
– Der Längengrad einer Station. Die Werte sind gültige WGS84-Längengrade im Dezimalgradformat.bike_stations.latitude
– Der Breitengrad einer Station. Die Werte sind gültige WGS84-Breitengrade im Dezimalgradformat.num_bikes_available
– Die Anzahl der zur Ausleihe verfügbaren Fahrräder.
Abfrage zu Fahrradstationen mit mehr als 30 verfügbaren Fahrrädern ausführen
In diesem Abschnitt der Anleitung führen Sie eine GoogleSQL-Abfrage aus, mit der alle Citi Bike-Stationen in New York City mit mehr als 30 verfügbaren Fahrrädern ermittelt werden.
Abfragedetails
Mit dieser GoogleSQL-Abfrage werden die Citi Bike-Stationen mit mehr als 30 Fahrrädern ermittelt:
SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Mit den Abfrageklauseln wird Folgendes ausgeführt:
SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
- Die Klausel
SELECT
wählt die Spaltenum_bikes_available
aus und verwendet dieST_GeogPoint
-Funktion, um die Werte in die Spaltenlatitude
undlongitude
zuGEOGRAPHY
-Typen (Punkte) zu konvertieren.
FROM `bigquery-public-data.new_york.citibike_stations`
- Die Klausel
FROM
legt die Tabelle fest, die abgefragt wird:citibike_stations
.
WHERE num_bikes_available > 30
- Die Klausel
WHERE
filtert die Werte in der Spaltenum_bikes_available
, sodass nur Stationen mit mehr als 30 Fahrrädern angezeigt werden.
Abfrage ausführen
So führen Sie die Abfrage mithilfe der Google Cloud Console aus:
Rufen Sie in der Google Cloud Console die Seite "BigQuery" auf.
Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.
-- Finds Citi Bike stations with > 30 bikes SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Klicken Sie auf Ausführen.
Die Abfrage kann einen Moment dauern. Nach der Ausführung werden die Ergebnisse der Abfrage im Fenster Abfrageergebnisse angezeigt.
Abfrageergebnisse in Geo Viz visualisieren
Als Nächstes visualisieren Sie die Ergebnisse mit BigQuery Geo Viz, einem Webtool zur Visualisierung von Geodaten in BigQuery mithilfe von Google Maps APIs.
Geo Viz starten und authentifizieren
Für die Verwendung von Geo Viz müssen Sie sich authentifizieren und Geo Viz die Berechtigung für den Zugriff auf Daten in BigQuery erteilen.
So richten Sie Geo Viz ein:
Rufen Sie das Webtool Geo Viz auf.
Möglicherweise müssen Sie Cookies aktivieren, um dieses Tool zu autorisieren und zu verwenden.
Klicken Sie unter Schritt 1, Abfrage auf Autorisieren.
Klicken Sie im Dialogfeld Konto auswählen auf Ihr Google-Konto.
Klicken Sie im Dialogfeld für den Zugriff auf Zulassen, um Geo Viz Zugriff auf Ihre BigQuery-Daten zu geben.
GoogleSQL-Abfrage für raumbezogene Daten ausführen
Führen Sie als Nächstes die Abfrage in Geo Viz aus, nachdem Sie sich authentifiziert und Geo Viz Zugriff gegeben haben.
So führen Sie die Abfrage aus:
Geben Sie für Schritt 1, Select Data (Daten auswählen), Ihre Projekt-ID in das Feld Project ID (Projekt-ID) ein.
Geben Sie im Abfragefenster die folgende GoogleSQL-Abfrage ein.
-- Finds Citi Bike stations with > 30 bikes SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available FROM `bigquery-public-data.new_york.citibike_stations` WHERE num_bikes_available > 30
Klicken Sie auf Ausführen.
Klicken Sie auf Ergebnisse anzeigen, wenn die Abfrage abgeschlossen ist. Sie können auch auf Schritt 2, Spalten definieren, klicken.
Dies führt zu Schritt 2. Wählen Sie in Schritt 2 für Geometriespalte die Option WKT aus. Damit werden die Punkte angezeigt, die den Fahrradstationen auf Ihrer Karte entsprechen.
Visualisierung formatieren
Der Abschnitt "Style" (Stil) enthält eine Liste visueller Stile für die individuelle Gestaltung. Bestimmte Attribute gelten nur für bestimmte Datentypen. Beispielsweise betrifft circleRadius
nur Punkte.
Diese Stilattribute werden unterstützt:
- fillColor. Die Füllfarbe eines Polygons oder Punkts. Beispielsweise können einem Farbverlauf mit den Funktionen "linear" oder "interval" numerische Werte zugeordnet werden.
- fillOpacity. Die Fülldeckkraft eines Polygons oder Punkts. Die Werte müssen im Bereich zwischen 0 und 1 liegen, wobei
0
= transparent und1
= undurchsichtig ist. - strokeColor – Die Strich- bzw. Umrissfarbe eines Polygons oder einer Linie.
- strokeOpacity. Die Strich- bzw. Umrissdeckkraft eines Polygons oder einer Linie.
Die Werte müssen im Bereich zwischen 0 und 1 liegen, wobei
0
= transparent und1
= undurchsichtig ist. - strokeWeight – Die Strich- bzw. Umrissstärke eines Polygons oder einer Linie in Pixeln.
- circleRadius. Der Radius des Kreises, der einen Punkt in Pixeln darstellt. Beispielsweise können mit der Funktion "linear" numerische Werte Punktgrößen zugeordnet werden, um den Stil eines Streudiagramms zu erzeugen.
Jedem Stil kann entweder ein globaler Wert zugewiesen werden, der für jedes Ergebnis gilt, oder ein datengesteuerter Wert, der von den Daten in den einzelnen Ergebniszeilen abhängig ist. Für die Berechnung datengesteuerter Werte gibt es diese Möglichkeiten:
- function – Eine Funktion zur Berechnung eines Stilwerts aus Feldwerten.
- identity – Der Datenwert jedes Feldes wird als Stilwert verwendet.
- categorical – Die Datenwerte der einzelnen in der Domain aufgeführten Felder werden 1:1 den Skalen der entsprechenden Stile zugeordnet.
- interval – Die Datenwerte jedes Feldes werden auf den nächsten Wert in der Domain abgerundet und dann mit dem entsprechenden Stil im Bereich versehen.
- linear – Die Datenwerte jedes Feldes werden linear über die Werte in der Domain interpoliert und dann mit einer Kombination der entsprechenden Stile im Bereich versehen.
- field – Das angegebene Feld in den Daten wird als Eingabe für die Stilfunktion verwendet.
- domain – Eine strukturierte Liste von Beispieleingabewerten aus einem Feld. Beispieleingaben (domain) werden anhand der jeweiligen Funktion mit Beispielausgaben (range) paarweise kombiniert und dann zur Ableitung von Stilwerten für alle Eingaben verwendet – auch für solche, die nicht in der Domain aufgeführt sind. Die Werte in der Domain müssen den gleichen Typ (Text, Zahl usw.) wie die Feldwerte haben, die visualisiert werden.
- range. Eine Liste mit Beispielausgabewerten für die Stilregel. Die Werte im Bereich müssen den gleichen Typ (Farbe oder Zahl) wie das von Ihnen festgelegte Stilattribut haben. Der Bereich des Attributs
fillColor
darf beispielsweise nur Farben enthalten.
So formatieren Sie Ihre Karte:
Klicken Sie in Schritt 2 auf Add styles oder klicken Sie auf Schritt 3, Style.
Ändern Sie die Farbe Ihrer Punkte. Klicken Sie auf fillColor.
Geben Sie in das Feld Value den Wert
#0000FF
ein, den HTML-Farbcode für Blau.Klicken Sie auf Stil anwenden.
Prüfen Sie die Karte. Wenn Sie auf einen Ihrer Punkte klicken, wird der Wert angezeigt.
Klicken Sie auf fillOpacity.
Geben Sie in das Feld Wert
0.5
ein und klicken Sie auf Stil anwenden.Prüfen Sie die Karte. Die Füllfarbe der Punkte ist jetzt halbdurchsichtig.
Ändern Sie die Größe der Punkte nach der Anzahl der verfügbaren Fahrräder. Klicken Sie auf circleRadius.
Im Fenster circleRadius führen Sie folgende Aktionen aus:
- Klicken Sie auf Data driven.
- Wählen Sie für Function die Option linear aus.
- Wählen Sie für Field die Option
num_bikes_available
aus. - Geben Sie für Domain den Wert
30
in das erste Feld und den Wert60
in das zweite Feld ein. Geben Sie für Range in das erste Feld
5
und in das zweite Feld20
ein.
Prüfen Sie die Karte. Der Radius jedes Kreises entspricht nun der Anzahl der verfügbaren Fahrräder an diesem Ort.
Schließen Sie Geo Viz.
Bereinigen
Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, löschen Sie entweder das Projekt, das die Ressourcen enthält, oder Sie behalten das Projekt und löschen die einzelnen Ressourcen.
- Sie können das von Ihnen erstellte Projekt löschen.
- Sie können das Projekt für eine zukünftige Verwendung auch beibehalten
So löschen Sie das Projekt:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Nächste Schritte
- Weitere Informationen zu Visualisierungsoptionen für raumbezogene Analysen finden Sie unter Raumbezogene Daten visualisieren.
- Weitere Informationen zur Arbeit mit raumbezogenen Analysedaten finden Sie unter Mit raumbezogenen Daten arbeiten.
- Eine Anleitung zur Verwendung von raumbezogenen Analysen finden Sie unter Raumbezogene Analysen zur Darstellung des Wegs eines Hurrikans verwenden.
- Mehr über Funktionen von GoogleSQL in raumbezogenen Analysen finden Sie unter Geografische Funktionen in GoogleSQL.