Daten mit der Google Cloud Console laden und abfragen

Erfahren Sie, wie Sie mit der Google Cloud Console ein Dataset erstellen, Beispieldaten in eine BigQuery-Tabelle laden und Tabellen abfragen.


Eine detaillierte Anleitung zu dieser Aufgabe finden Sie direkt in der Cloud Console. Klicken Sie dazu einfach auf Anleitung:

Anleitung


Die folgenden Abschnitte führen Sie durch dieselben Schritte wie das Klicken auf Anleitung.

Vorbereitung

Bevor Sie sich BigQuery genauer ansehen können, müssen Sie sich in der Cloud Console anmelden und ein Projekt erstellen. Wenn Sie die Abrechnung in Ihrem Projekt nicht aktivieren, befinden sich alle Daten, die Sie hochladen, in der BigQuery-Sandbox. So können Sie BigQuery kostenlos nutzen, während Sie mit einer begrenzten Anzahl von BigQuery-Features arbeiten. Weitere Informationen zur BigQuery-Sandbox, einschließlich Einschränkungen, dem Hinzufügen eines Rechnungskontos, dem Upgrade Ihres Projekts und zur Fehlerbehebung finden Sie unter BigQuery-Sandbox aktivieren.

  1. Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  4. Optional: Wenn Sie ein vorhandenes Projekt auswählen, müssen Sie die BigQuery API aktivieren. BigQuery API ist in neuen Projekten automatisch aktiviert.

BigQuery-Dataset erstellen

Erstellen Sie mit der Cloud Console ein Dataset, in dem die Daten gespeichert werden.

  1. Öffnen Sie in der Cloud Console die Seite „BigQuery“.
  2. BigQuery aufrufen
  3. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
  4. Maximieren Sie Ansichtsaktionen > Dataset erstellen.
  5. Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:
    1. Geben Sie unter Dataset-ID babynames ein.
    2. Wählen Sie aus der Liste Speicherort der Daten die Option us (mehrere Regionen in den USA) aus. Derzeit sind die öffentlichen Datasets am multiregionalen Standort us gespeichert. Der Einfachheit halber sollten Sie Ihr Dataset am selben Standort speichern.
    3. Übernehmen Sie die verbleibenden Standardeinstellungen und klicken Sie auf Dataset erstellen.

Quelldaten-Datei herunterladen

Die heruntergeladene Datei enthält ca. 7 MB an Daten zu beliebten Babynamen. Sie wird von der US-amerikanischen Sozialversicherungsbehörde bereitgestellt.

Weitere Informationen zum Dataset finden Sie auf der Seite der Sozialversicherungsbehörde mit Dataset-Informationen.

  1. Laden Sie das Dataset der US-amerikanischen Sozialversicherungsbehörde herunter. Öffnen Sie dazu folgende URL in einem neuen Browsertab:

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. Extrahieren Sie die Datei.

    Weitere Informationen zum Dataset-Schema finden Sie in der Datei NationalReadMe.pdf in der ZIP-Datei.

  3. Um sich die Daten anzusehen, öffnen Sie die Datei yob2014.txt. Diese Datei enthält durch Kommas getrennte Werte für Name, Geschlecht (M oder F) und die Anzahl der Kinder mit dem entsprechenden Namen. Die Datei hat keine Kopfzeile.

  4. Notieren Sie sich den Speicherort der Datei yob2014.txt, damit Sie sie später wiederfinden.

Daten in eine Tabelle laden

Als Nächstes laden Sie die Daten in eine neue Tabelle.

  1. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
  2. Klicken Sie neben dem Dataset babynames auf Weitere Aktionen und wählen Sie Öffnen.
  3. Klicken Sie im Detailfeld auf Tabelle erstellen.

    Sofern nicht anders angegeben, verwenden Sie für alle Einstellungen die Standardwerte.

  4. Führen Sie auf der Seite Tabelle erstellen die folgenden Schritte aus:
    1. Wählen Sie im Abschnitt Quelle Hochladen aus der Liste Tabelle erstellen durch aus.
    2. Klicken Sie im Feld Datei auswählen auf Durchsuchen.
    3. Öffnen Sie Ihre lokale Datei yob2014.txt und klicken Sie auf Öffnen.
    4. Wählen Sie in der Liste Dateiformat die Option CSV aus.
    5. Geben Sie im Abschnitt Ziel names_2014 für den Tabellennamen ein.
    6. Klicken Sie im Abschnitt Schema auf die Ein-/Aus-Schaltfläche Als Text bearbeiten und fügen Sie die folgende Schemadefinition in das Textfeld ein:
    7. name:string,gender:string,count:integer
    8. Klicken Sie auf Tabelle erstellen.
      Warten Sie, bis BigQuery die Tabelle erstellt und die Daten geladen hat. Wenn BigQuery das Laden der Daten abgeschlossen hat, maximieren Sie die Bereiche Persönlicher Verlauf und Projektverlauf, um sich die Jobdetails anzusehen.

Vorschau von Tabellendaten

So lassen Sie die Tabellendaten in der Vorschau anzeigen:

  1. Maximieren Sie im Bereich Explorer Ihr Projekt und das Dataset babynames und wählen Sie die Tabelle names_2014 aus.
  2. Klicken Sie im Detailbereich auf Vorschau. BigQuery zeigt die ersten Zeilen der Tabelle an.
  3. BigQuery zeigt die ersten Zeilen der Tabelle an. Cloud Console-Tabellenvorschau
Die Vorschau ist nicht für alle Tabellentypen verfügbar. Beispielsweise wird der Tab Vorschau nicht für externe Tabellen oder Ansichten angezeigt.

Tabellendaten abfragen

Fragen Sie als Nächstes die Tabelle ab. Die Vorgehensweise ist mit dem vorangegangenen Beispiel identisch, nur dass Sie jetzt anstelle einer öffentlichen Tabelle Ihre eigene Tabelle abfragen.

  1. Klicken Sie auf Neue Abfrage erstellen. Ein neuer Tab Editor wird geöffnet.
  2. Fügen Sie im Tab Editor folgende Abfrage ein: Diese Abfrage ruft die fünf beliebtesten männlichen Babynamen in den USA für das Jahr 2014 ab.
    
        SELECT
          name,
          count
        FROM
          `babynames.names_2014`
        WHERE
          gender = 'M'
        ORDER BY
          count DESC
        LIMIT
          5
        
  3. Klicken Sie auf Ausführen. Die Ergebnisse werden im Abschnitt Abfrageergebnisse angezeigt.
    Ergebnisse der Namensabfrage

Sie haben erfolgreich eine Tabelle in einem öffentlichen Dataset abgefragt und dann Ihre Beispieldaten mit der Cloud Console in BigQuery geladen.

Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:

  1. Öffnen Sie in der Cloud Console die Seite „BigQuery“.
  2. BigQuery aufrufen
  3. Klicken Sie im Bereich Explorer auf das von Ihnen erstellte Dataset babynames.
  4. Maximieren Sie die Option Aktionen ansehen und klicken Sie auf Löschen.
  5. Bestätigen Sie im Dialogfeld Dataset löschen den Löschbefehl: Geben Sie dafür das Wort delete ein und klicken Sie auf Löschen.

Nächste Schritte