Daten mit der Google Cloud Console laden und abfragen

Erfahren Sie, wie Sie mit der Google Cloud Console ein Dataset erstellen, Beispieldaten in eine BigQuery-Tabelle laden und Tabellen abfragen.


Klicken Sie auf Anleitung, um eine detaillierte Anleitung für diese Aufgabe direkt in der Google Cloud Console aufzurufen.

Anleitung


Hinweis

Bevor Sie sich BigQuery genauer ansehen können, müssen Sie sich in der Google Cloud Console anmelden und ein Projekt erstellen. Wenn Sie die Abrechnung in Ihrem Projekt nicht aktivieren, befinden sich alle hochgeladenen Daten in der BigQuery-Sandbox. Mithilfe der Sandbox können Sie sich kostenlos mit BigQuery vertraut machen, während Sie mit einer begrenzten Anzahl von BigQuery-Features arbeiten. Weitere Informationen finden Sie unter BigQuery-Sandbox aktivieren.

  1. Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  4. Optional: Wenn Sie ein vorhandenes Projekt auswählen, müssen Sie die BigQuery API aktivieren. Die BigQuery-API wird in neuen Projekten automatisch aktiviert.

BigQuery-Dataset erstellen

Erstellen Sie mit der Google Cloud Console ein Dataset, in dem die Daten gespeichert werden.

  1. Öffnen Sie in der Google Cloud Console die Seite „BigQuery“.
  2. BigQuery aufrufen
  3. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
  4. Maximieren Sie Ansichtsaktionen > Dataset erstellen.
  5. Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:
    1. Geben Sie unter Dataset-ID babynames ein.
    2. Wählen Sie aus der Liste Speicherort der Daten die Option us (mehrere Regionen in den USA) aus. Derzeit sind die öffentlichen Datasets am multiregionalen Standort us gespeichert. Der Einfachheit halber sollten Sie Ihr Dataset am selben Standort speichern.
    3. Übernehmen Sie die verbleibenden Standardeinstellungen und klicken Sie auf Dataset erstellen.

Quelldaten-Datei herunterladen

Die heruntergeladene Datei enthält ca. 7 MB an Daten zu beliebten Babynamen. Sie wird von der US-amerikanischen Sozialversicherungsbehörde bereitgestellt.

Weitere Informationen zum Dataset finden Sie auf der Seite der Sozialversicherungsbehörde mit Dataset-Informationen.

  1. Laden Sie das Dataset der US-amerikanischen Sozialversicherungsbehörde herunter. Öffnen Sie dazu folgende URL in einem neuen Browsertab:

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. Extrahieren Sie die Datei.

    Weitere Informationen zum Dataset-Schema finden Sie in der Datei NationalReadMe.pdf in der ZIP-Datei.

  3. Um sich die Daten anzusehen, öffnen Sie die Datei yob2014.txt. Diese Datei enthält durch Kommas getrennte Werte für den Namen, das zugewiesene Geschlecht und die Anzahl der Kinder mit diesem Namen. Die Datei hat keine Kopfzeile.

  4. Notieren Sie sich den Speicherort der Datei yob2014.txt, damit Sie sie später wiederfinden.

Daten in eine Tabelle laden

Als Nächstes laden Sie die Daten in eine neue Tabelle.

  1. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
  2. Klicken Sie neben dem Dataset babynames auf Weitere Aktionen und wählen Sie Öffnen.
  3. Klicken Sie im Detailfeld auf Tabelle erstellen.

    Sofern nicht anders angegeben, verwenden Sie für alle Einstellungen die Standardwerte.

  4. Führen Sie auf der Seite Tabelle erstellen die folgenden Schritte aus:
    1. Wählen Sie im Abschnitt Quelle die Option Hochladen aus der Liste Tabelle erstellen aus aus.
    2. Klicken Sie im Feld Datei auswählen auf Durchsuchen.
    3. Öffnen Sie Ihre lokale Datei yob2014.txt und klicken Sie auf Öffnen.
    4. Wählen Sie in der Liste Dateiformat die Option CSV aus.
    5. Geben Sie im Abschnitt Ziel names_2014 für den Tabellennamen ein.
    6. Klicken Sie im Abschnitt Schema auf die Ein/Aus-Schaltfläche Als Text bearbeiten und fügen Sie die folgende Schemadefinition in das Textfeld ein:
    7. name:string,assigned_sex_at_birth:string,count:integer
    8. Klicken Sie auf Tabelle erstellen.

      Warten Sie, bis BigQuery die Tabelle erstellt und die Daten geladen hat. Wenn BigQuery das Laden der Daten abgeschlossen hat, maximieren Sie die Bereiche Persönlicher Verlauf und Projektverlauf, um sich die Jobdetails anzusehen.

Vorschau von Tabellendaten

So lassen Sie die Tabellendaten in der Vorschau anzeigen:

  1. Maximieren Sie im Bereich Explorer Ihr Projekt und das Dataset babynames und wählen Sie die Tabelle names_2014 aus.
  2. Klicken Sie im Detailbereich auf Vorschau. BigQuery zeigt die ersten Zeilen der Tabelle an.
  3. Grafik: Google Cloud Console-Tabellenvorschau
Die Vorschau ist nicht für alle Tabellentypen verfügbar. Beispielsweise wird der Tab Vorschau nicht für externe Tabellen oder Ansichten angezeigt.

Tabellendaten abfragen

Fragen Sie als Nächstes die Tabelle ab. Die Vorgehensweise ist mit dem vorangegangenen Beispiel identisch, nur dass Sie jetzt anstelle einer öffentlichen Tabelle Ihre eigene Tabelle abfragen.

  1. Klicken Sie auf Neue Abfrage erstellen. Ein neuer Tab Editor wird geöffnet.
  2. Fügen Sie im Tab Editor die folgende Abfrage ein: Diese Abfrage ruft die fünf beliebtesten Namen für Babys in den USA ab, denen bei der Geburt in 2014 das männliche Geschlecht zugewiesen wurde.
    
        SELECT
          name,
          count
        FROM
          `babynames.names_2014`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
  3. Klicken Sie auf Ausführen. Die Ergebnisse werden im Abschnitt Abfrageergebnisse angezeigt.
    Ergebnisse der Namensabfrage

Sie haben erfolgreich eine Tabelle in einem öffentlichen Dataset abgefragt und dann Ihre Beispieldaten mit der Cloud Console in BigQuery geladen.

Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:

  1. Öffnen Sie in der Google Cloud Console die Seite „BigQuery“.
  2. BigQuery aufrufen
  3. Klicken Sie im Bereich Explorer auf das von Ihnen erstellte Dataset babynames.
  4. Maximieren Sie die Option Aktionen ansehen und klicken Sie auf Löschen.
  5. Bestätigen Sie im Dialogfeld Dataset löschen den Löschbefehl: Geben Sie dafür das Wort delete ein und klicken Sie auf Löschen.

Nächste Schritte