Öffentliches Dataset abfragen und Ergebnisse visualisieren

Hier erfahren Sie, wie Sie ein öffentliches Dataset abfragen und die Ergebnisse in BigQuery visualisieren.


Eine detaillierte Anleitung dazu finden Sie direkt in der Google Cloud Console. Klicken Sie dazu einfach auf Anleitung:

Anleitung


Hinweise

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      IAM aufrufen
    2. Wählen Sie das Projekt aus.
    3. Klicken Sie auf Zugriffsrechte erteilen.
    4. Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Das ist in der Regel die E‑Mail-Adresse eines Google-Kontos.

    5. Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
    6. Klicken Sie auf Weitere Rolle hinzufügen, wenn Sie weitere Rollen zuweisen möchten.
    7. Klicken Sie auf Speichern.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that you have the following role or roles on the project: BigQuery Job User, Service Usage Admin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      IAM aufrufen
    2. Wählen Sie das Projekt aus.
    3. Klicken Sie auf Zugriffsrechte erteilen.
    4. Geben Sie im Feld Neue Hauptkonten Ihre Nutzer-ID ein. Das ist in der Regel die E‑Mail-Adresse eines Google-Kontos.

    5. Wählen Sie in der Liste Rolle auswählen eine Rolle aus.
    6. Klicken Sie auf Weitere Rolle hinzufügen, wenn Sie weitere Rollen zuweisen möchten.
    7. Klicken Sie auf Speichern.
  6. Verify that billing is enabled for your Google Cloud project.

  7. Wenn Sie die Abrechnung für das Google Cloud -Projekt, das Sie in dieser Anleitung verwenden, nicht aktivieren, fragen Sie die öffentlichen Daten in der BigQuery-Sandbox ab. Mit der BigQuery-Sandbox können Sie BigQuery mit einer begrenzten Anzahl von BigQuery-Features kostenlos nutzen.

  8. Die BigQuery API muss aktiviert sein.

    API aktivieren

    Wenn Sie ein neues Projekt erstellt haben, wird die BigQuery API automatisch aktiviert.

  9. Öffentliches Dataset ansehen

    Öffentliche BigQuery-Datasets sind standardmäßig in BigQuery Studio in einem Projekt mit dem Namen bigquery-public-data verfügbar. In diesem Tutorial fragen Sie das Dataset „NYC Citi Bike Trips“ ab. Citi Bike ist ein großes Fahrradverleihprogramm mit 10.000 Fahrrädern und 600 Stationen in Manhattan, Brooklyn, Queens und Jersey City. Dieses Dataset enthält Citi Bike-Fahrten seit der Einführung von Citi Bike im September 2013.

    1. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

      BigQuery aufrufen

    2. Klicken Sie in BigQuery Studio im Bereich Explorer auf Daten hinzufügen.

    3. Klicken Sie im Dialogfeld Daten hinzufügen im Bereich Filtern nach auf Symbol für öffentliches Dataset auf der Seite „Filtern nach“ Öffentliche Datasets.

    4. Geben Sie auf der Seite Marketplace im Feld Im Marketplace suchen NYC Citi Bike Trips ein, um die Suche einzugrenzen.

    5. Klicken Sie in den Suchergebnissen auf NYC Citi Bike Trips.

    6. Klicken Sie auf der Seite Produktdetails auf Dataset ansehen. Informationen zum Datensatz finden Sie auf dem Tab Details.

    Öffentliches Dataset abfragen

    In den folgenden Schritten fragen Sie die Tabelle citibike_trips ab, um die 100 beliebtesten Citi Bike-Stationen im öffentlichen Dataset „NYC Citi Bike Trips“ zu ermitteln. Mit der Abfrage werden der Name und der Standort der Station sowie die Anzahl der Fahrten abgerufen, die an dieser Station begonnen haben.

    In der Abfrage wird die Funktion ST_GEOGPOINT verwendet, um einen Punkt aus den Parametern für Längengrad und Breitengrad jeder Station zu erstellen. Dieser Punkt wird in einer GEOGRAPHY-Spalte zurückgegeben. Die Spalte GEOGRAPHY wird verwendet, um eine Heatmap im integrierten geografischen Datenviewer zu erstellen.

    1. Öffnen Sie in der Google Cloud Console die Seite BigQuery.

      BigQuery aufrufen

    2. Klicken Sie auf . <ph type="x-smartling-placeholder"></ph> SQL-Abfrage.

    3. Geben Sie im Abfrageeditor die folgende Abfrage ein:

      SELECT
        start_station_name,
        start_station_latitude,
        start_station_longitude,
        ST_GEOGPOINT(start_station_longitude, start_station_latitude) AS geo_location,
        COUNT(*) AS num_trips
      FROM
        `bigquery-public-data.new_york.citibike_trips`
      GROUP BY
        1,
        2,
        3
      ORDER BY
        num_trips DESC
      LIMIT
        100;
      

      Wenn die Abfrage gültig ist, wird ein Häkchen zusammen mit der Datenmenge angezeigt, die durch die Abfrage verarbeitet wird. Wenn die Abfrage ungültig ist, wird ein Ausrufezeichen mit einer Fehlermeldung angezeigt.

      Abfragevalidierung

    4. Klicken Sie auf Ausführen. Die beliebtesten Sender werden im Abschnitt Abfrageergebnisse aufgeführt.

      Abfrageergebnisse in der Google Cloud Console

    5. Optional: Klicken Sie zum Aufrufen der Dauer des Jobs und der Datenmenge, die vom Abfragejob verarbeitet wurde, im Abschnitt Abfrageergebnisse auf den Tab Jobinformationen.

    6. Wechseln Sie zum Tab Visualisierung. Auf diesem Tab wird eine Karte generiert, um Ihre Ergebnisse schnell zu visualisieren.

    7. Im Bereich Visualisierungskonfiguration:

      1. Prüfen Sie, ob Visualisierungstyp auf Karte festgelegt ist.
      2. Prüfen Sie, ob die Spalte für geografische Einheiten auf geo_location festgelegt ist.
      3. Wählen Sie für Datenspalte die Option num_trips aus.
      4. Verwenden Sie die Option Zoom in (Heranzoomen), um die Karte von Manhattan aufzurufen.

      Eine Heatmap, die auf dem Tab „Visualisierung“ generiert wurde

    Bereinigen

    Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:

    Projekt löschen

    Wenn Sie das öffentliche Dataset mit der BigQuery-Sandbox abgefragt haben, ist die Abrechnung für Ihr Projekt nicht aktiviert und Sie müssen das Projekt nicht löschen.

    Am einfachsten vermeiden Sie weitere Kosten, wenn Sie das zum Ausführen der Anleitung erstellte Projekt löschen.

    So löschen Sie das Projekt:

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    Nächste Schritte