Erste Schritte mit raumbezogenen Analysen


In dieser Anleitung lernen Sie raumbezogene Analysen kennen. Mit raumbezogenen Analysen können Sie raumbezogene Daten in BigQuery analysieren und visualisieren.

Lernziele

In dieser Anleitung lernen Sie, wie Sie:

  • Verwenden Sie eine raumbezogene Analysefunktion, um Breiten- und Längengradspalten in geografische Punkte umzuwandeln
  • Eine Abfrage ausführen, mit der alle Citi Bike-Stationen mit mehr als 30 verfügbaren Leihfahrrädern ermittelt werden
  • Ihre Ergebnisse in BigQuery Geo Viz visualisieren.

Kosten

In dieser Anleitung werden kostenpflichtige Komponenten von Google Cloud verwendet, darunter auch BigQuery.

Kostenpflichtig sind:

  • Abfragen von Daten in den öffentlichen BigQuery-Datasets
    • Die ersten 1 TB pro Monat sind kostenlos
    • Wenn Sie einen Pauschalpreis verwenden, sind die Abfragekosten im monatlichen Pauschalpreis enthalten.

Vorbereitung

  1. Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

  4. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  5. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

  6. BigQuery ist in neuen Projekten automatisch aktiviert. Öffnen Sie zum Aktivieren von BigQuery in einem bestehenden Projekt

    BigQuery API aktivieren.

    Aktivieren Sie die API

    .

Beispieldaten prüfen

In dieser Anleitung wird ein Dataset aus dem Google Cloud Public Dataset-Programm verwendet. Ein öffentliches Dataset ist ein Dataset, das in BigQuery gespeichert ist und der Allgemeinheit zugänglich gemacht wird. Die öffentlichen Datasets werden für Sie von BigQuery gehostet, damit Sie auf sie zugreifen und sie in Ihre Anwendungen integrieren können. Google bezahlt die Speicherung dieser Datasets und bietet einen öffentlichen Zugriff auf die Daten über ein Projekt. Sie bezahlen nur für die Abfrage der Daten. Die ersten 1 TB pro Monat sind kostenlos. Weitere Informationen erhalten Sie unter Details der Abfragepreise.

Dataset "NYC Citi Bike Trips"

NYC Citi Bike Trips

Citi Bike ist das größte Fahrradverleihprogramm der USA mit 10.000 Fahrrädern und 600 Stationen in Manhattan, Brooklyn, Queens und Jersey City. Dieses Dataset enthält Citi Bike-Fahrten seit der Einführung von Citi Bike im September 2013 und wird täglich aktualisiert. Die Daten werden von Citi Bike verarbeitet, um Personalfahrten zur Wartung und Inspektion der Anlage sowie Fahrten unter 60 Sekunden, die als Fehlstart betrachtet werden, zu entfernen.

Sie können sich diese Daten in der BigQuery-Konsole genauer ansehen und dafür die Details der Tabelle citibike_stations aufrufen:

Zum Schema citibike_stations

Für diese Anleitung sind drei Spalten in dieser Tabelle relevant:

  • bike_stations.longitude – Der Längengrad einer Station. Die Werte sind gültige WGS84-Längengrade im Dezimalgradformat.
  • bike_stations.latitude – Der Breitengrad einer Station. Die Werte sind gültige WGS84-Breitengrade im Dezimalgradformat.
  • num_bikes_available – Die Anzahl der zur Ausleihe verfügbaren Fahrräder.

Abfrage zu Fahrradstationen mit mehr als 30 verfügbaren Fahrrädern ausführen

In diesem Abschnitt der Anleitung führen Sie eine GoogleSQL-Abfrage aus, mit der alle Citi Bike-Stationen in New York City mit mehr als 30 verfügbaren Fahrrädern ermittelt werden.

Abfragedetails

Mit dieser GoogleSQL-Abfrage werden die Citi Bike-Stationen mit mehr als 30 Fahrrädern ermittelt:

SELECT
  ST_GeogPoint(longitude, latitude)  AS WKT,
  num_bikes_available
FROM
  `bigquery-public-data.new_york.citibike_stations`
WHERE num_bikes_available > 30

Mit den Abfrageklauseln wird Folgendes ausgeführt:

  • SELECT ST_GeogPoint(longitude, latitude) AS WKT, num_bikes_available
    Die Klausel SELECT wählt die Spalte num_bikes_available aus und verwendet die ST_GeogPoint-Funktion, um die Werte in die Spalten latitude und longitude zu GEOGRAPHY-Typen (Punkte) zu konvertieren.
  • FROM `bigquery-public-data.new_york.citibike_stations`
    Die Klausel FROM legt die Tabelle fest, die abgefragt wird: citibike_stations.
  • WHERE num_bikes_available > 30
    Die Klausel WHERE filtert die Werte in der Spalte num_bikes_available, sodass nur Stationen mit mehr als 30 Fahrrädern angezeigt werden.

Abfrage ausführen

So führen Sie die Abfrage mithilfe der Google Cloud Console aus:

  1. Rufen Sie in der Google Cloud Console die Seite "BigQuery" auf.

    Zur Seite „BigQuery“

  2. Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Klicken Sie auf Ausführen.

    Die Abfrage kann etwas dauern. Nach der Ausführung werden die Ergebnisse der Abfrage im Fenster Abfrageergebnisse angezeigt.

    Ergebnisse der Fahrradstationsabfrage

Abfrageergebnisse in Geo Viz visualisieren

Als Nächstes visualisieren Sie die Ergebnisse mit BigQuery Geo Viz, einem Webtool zur Visualisierung von Geodaten in BigQuery mithilfe von Google Maps APIs.

Geo Viz starten und authentifizieren

Für die Verwendung von Geo Viz müssen Sie sich authentifizieren und Geo Viz die Berechtigung für den Zugriff auf Daten in BigQuery erteilen.

So richten Sie Geo Viz ein:

  1. Rufen Sie das Webtool Geo Viz auf.

    Zum Geo Viz-Webtool

    Möglicherweise müssen Sie Cookies aktivieren, um dieses Tool zu autorisieren und zu verwenden.

  2. Klicken Sie unter Schritt 1 auf Abfrage und dann auf Autorisieren.

    Schaltfläche zur Geo Viz-Autorisierung

  3. Klicken Sie im Dialogfeld Konto auswählen auf Ihr Google-Konto.

    Dialogfeld zum Auswählen des Kontos

  4. Klicken Sie im Dialogfeld für den Zugriff auf Zulassen, um Geo Viz Zugriff auf Ihre BigQuery-Daten zu geben.

    Dialogfeld zum Gewähren des Zugriffs

GoogleSQL-Abfrage für raumbezogene Daten ausführen

Führen Sie als Nächstes die Abfrage in Geo Viz aus, nachdem Sie sich authentifiziert und Geo Viz Zugriff gegeben haben.

So führen Sie die Abfrage aus:

  1. Geben Sie für Schritt 1, Select Data (Daten auswählen), Ihre Projekt-ID in das Feld Project ID (Projekt-ID) ein.

  2. Geben Sie im Abfragefenster die folgende GoogleSQL-Abfrage ein.

    -- Finds Citi Bike stations with > 30 bikes
    SELECT
      ST_GeogPoint(longitude, latitude)  AS WKT,
      num_bikes_available
    FROM
      `bigquery-public-data.new_york.citibike_stations`
    WHERE num_bikes_available > 30
    
  3. Klicken Sie auf Ausführen.

  4. Klicken Sie auf Ergebnisse anzeigen, wenn die Abfrage abgeschlossen ist. Sie können auch auf Schritt 2, Spalten definieren, klicken.

    Ergebnisse ansehen

  5. Dies führt zu Schritt 2. Wählen Sie in Schritt 2 für Geometriespalte die Option WKT aus. Damit werden die Punkte angezeigt, die den Fahrradstationen auf Ihrer Karte entsprechen.

    Zugeordnete Ergebnisse

Visualisierung formatieren

Der Abschnitt "Style" (Stil) enthält eine Liste visueller Stile für die individuelle Gestaltung. Bestimmte Attribute gelten nur für bestimmte Datentypen. Beispielsweise betrifft circleRadius nur Punkte.

Diese Stilattribute werden unterstützt:

  • fillColor. Die Füllfarbe eines Polygons oder Punkts. Beispielsweise können einem Farbverlauf mit den Funktionen "linear" oder "interval" numerische Werte zugeordnet werden.
  • fillOpacity. Die Fülldeckkraft eines Polygons oder Punkts. Die Werte müssen im Bereich zwischen 0 und 1 liegen, wobei 0 = transparent und 1 = undurchsichtig ist.
  • strokeColor – Die Strich- bzw. Umrissfarbe eines Polygons oder einer Linie.
  • strokeOpacity. Die Strich- bzw. Umrissdeckkraft eines Polygons oder einer Linie. Die Werte müssen im Bereich zwischen 0 und 1 liegen, wobei 0 = transparent und 1 = undurchsichtig ist.
  • strokeWeight – Die Strich- bzw. Umrissstärke eines Polygons oder einer Linie in Pixeln.
  • circleRadius. Der Radius des Kreises, der einen Punkt in Pixeln darstellt. Beispielsweise können mit der Funktion "linear" numerische Werte Punktgrößen zugeordnet werden, um den Stil eines Streudiagramms zu erzeugen.

Jedem Stil kann entweder ein globaler Wert zugewiesen werden, der für jedes Ergebnis gilt, oder ein datengesteuerter Wert, der von den Daten in den einzelnen Ergebniszeilen abhängig ist. Für die Berechnung datengesteuerter Werte gibt es diese Möglichkeiten:

  • function – Eine Funktion zur Berechnung eines Stilwerts aus Feldwerten.
  • identity – Der Datenwert jedes Feldes wird als Stilwert verwendet.
  • categorical – Die Datenwerte der einzelnen in der Domain aufgeführten Felder werden 1:1 den Skalen der entsprechenden Stile zugeordnet.
  • interval – Die Datenwerte jedes Feldes werden auf den nächsten Wert in der Domain abgerundet und dann mit dem entsprechenden Stil im Bereich versehen.
  • linear – Die Datenwerte jedes Feldes werden linear über die Werte in der Domain interpoliert und dann mit einer Kombination der entsprechenden Stile im Bereich versehen.
  • field – Das angegebene Feld in den Daten wird als Eingabe für die Stilfunktion verwendet.
  • domain – Eine strukturierte Liste von Beispieleingabewerten aus einem Feld. Beispieleingaben (domain) werden anhand der jeweiligen Funktion mit Beispielausgaben (range) paarweise kombiniert und dann zur Ableitung von Stilwerten für alle Eingaben verwendet – auch für solche, die nicht in der Domain aufgeführt sind. Die Werte in der Domain müssen den gleichen Typ (Text, Zahl usw.) wie die Feldwerte haben, die visualisiert werden.
  • range. Eine Liste mit Beispielausgabewerten für die Stilregel. Die Werte im Bereich müssen den gleichen Typ (Farbe oder Zahl) wie das von Ihnen festgelegte Stilattribut haben. Der Bereich des Attributs fillColor darf beispielsweise nur Farben enthalten.

So formatieren Sie Ihre Karte:

  1. Klicken Sie in Schritt 2 auf Add styles oder klicken Sie auf Schritt 3, Style.

  2. Ändern Sie die Farbe Ihrer Punkte. Klicken Sie auf fillColor.

  3. Geben Sie in das Feld Value den Wert #0000FF ein, den HTML-Farbcode für Blau.

  4. Klicken Sie auf Stil anwenden.

    Füllfarbe

  5. Prüfen Sie die Karte. Wenn Sie auf einen Ihrer Punkte klicken, wird der Wert angezeigt.

    Details zu Kartenpunkten

  6. Klicken Sie auf fillOpacity.

  7. Geben Sie in das Feld Wert 0.5 ein und klicken Sie auf Stil anwenden.

    Fülldeckkraft

  8. Prüfen Sie die Karte. Die Füllfarbe der Punkte ist jetzt halbdurchsichtig.

    Karte mit halbdurchsichtigen Punkten

  9. Ändern Sie die Größe der Punkte nach der Anzahl der verfügbaren Fahrräder. Klicken Sie auf circleRadius.

  10. Im Fenster circleRadius führen Sie folgende Aktionen aus:

    1. Klicken Sie auf Data driven.
    2. Wählen Sie für Function die Option linear aus.
    3. Wählen Sie für Field (Feld) die Option num_bikes_available aus.
    4. Geben Sie für Domain den Wert 30 in das erste Feld und den Wert 60 in das zweite Feld ein.
    5. Geben Sie für Range in das erste Feld 5 und in das zweite Feld 20 ein.

      Kreisradius

  11. Prüfen Sie die Karte. Der Radius jedes Kreises entspricht nun der Anzahl der verfügbaren Fahrräder an diesem Ort.

    Endgültige Karte

  12. Schließen Sie Geo Viz.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, löschen Sie entweder das Projekt, das die Ressourcen enthält, oder Sie behalten das Projekt und löschen die einzelnen Ressourcen.

  • Sie können das von Ihnen erstellte Projekt löschen.
  • Sie können das Projekt für eine künftige Verwendung auch beibehalten

So löschen Sie das Projekt:

  1. Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.

    Zur Seite „Ressourcen verwalten“

  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.

Nächste Schritte