Daten laden und abfragen

Erstellen Sie zuerst ein Dataset, laden Sie Daten in eine Tabelle und fragen Sie die Tabelle ab.


Eine detaillierte Anleitung dazu finden Sie direkt in der Google Cloud Console. Klicken Sie dazu einfach auf Anleitung:

Anleitung


Hinweise

Bevor Sie sich BigQuery genauer ansehen können, müssen Sie sich in derGoogle Cloud Console anmelden und ein Projekt erstellen. Wenn Sie die Abrechnung in Ihrem Projekt nicht aktivieren, befinden sich alle hochgeladenen Daten in der BigQuery-Sandbox. Mithilfe der Sandbox können Sie sich kostenlos mit BigQuery vertraut machen, während Sie mit einer begrenzten Anzahl von BigQuery-Features arbeiten. Weitere Informationen finden Sie unter BigQuery-Sandbox aktivieren.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  4. Optional: Wenn Sie ein vorhandenes Projekt auswählen, müssen Sie die BigQuery API aktivieren. Die BigQuery-API wird in neuen Projekten automatisch aktiviert.
  5. BigQuery-Dataset erstellen

    Erstellen Sie mit der Google Cloud Console ein Dataset zum Speichern der Daten. Sie erstellen Ihr Dataset am multiregionalen Standort "US". Informationen zu BigQuery-Regionen und ‑Multiregionen finden Sie unter Standorte.

    1. Öffnen Sie in der Google Cloud Console die Seite „BigQuery“.
    2. BigQuery aufrufen
    3. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
    4. Klicken Sie auf  Aktionen ansehen.
    5. Wählen Sie Dataset erstellen aus.
    6. Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:
      1. Geben Sie unter Dataset-ID babynames ein.
      2. Wählen Sie als Standorttyp die Option Mehrere Regionen und dann USA (mehrere Regionen in den USA) aus. Die öffentlichen Datasets sind am multiregionalen Standort us gespeichert. Der Einfachheit halber sollten Sie Ihr Dataset am selben Speicherort speichern.
      3. Übernehmen Sie die verbleibenden Standardeinstellungen unverändert und klicken Sie auf Dataset erstellen.

    Datei mit den Quelldaten herunterladen

    Die heruntergeladene Datei enthält ca. 7 MB an Daten zu beliebten Babynamen. Sie wird von der US-amerikanischen Sozialversicherungsbehörde bereitgestellt.

    Weitere Informationen zu den Daten finden Sie auf der Seite Background information for popular names der US-amerikanischen Sozialversicherungsbehörde.

    1. Laden Sie die Daten der US-amerikanischen Sozialversicherungsbehörde herunter. Öffnen Sie dazu die folgende URL in einem neuen Browsertab:

      https://www.ssa.gov/OACT/babynames/names.zip
      
    2. Extrahieren Sie die Datei.

      Weitere Informationen zum Dataset-Schema finden Sie in der Datei NationalReadMe.pdf in der ZIP-Datei.

    3. Um sich die Daten anzusehen, öffnen Sie die Datei yob2024.txt. Diese Datei enthält kommagetrennte Werte für den Namen, das bei der Geburt zugewiesene Geschlecht und die Anzahl der Kinder mit diesem Namen. Die Datei hat keine Kopfzeile.

    4. Notieren Sie sich den Speicherort der Datei yob2024.txt, damit Sie sie später wiederfinden.

    Daten in eine Tabelle laden

    Als Nächstes laden Sie die Daten in eine neue Tabelle.

    1. Maximieren Sie im Bereich Explorer den Namen Ihres Projekts.
    2. Klicken Sie neben dem Dataset babynames auf  Aktionen ansehen und wählen Sie Öffnen aus.
    3. Klicken Sie auf  Tabelle erstellen.

      Sofern nicht anders angegeben, verwenden Sie für alle Einstellungen die Standardwerte.

    4. Führen Sie auf der Seite Tabelle erstellen die folgenden Schritte aus:
      1. Wählen Sie im Abschnitt Quelle unter Tabelle erstellen aus die Option Hochladen aus der Liste aus.
      2. Klicken Sie im Feld Datei auswählen auf Durchsuchen.
      3. Öffnen Sie Ihre lokale Datei yob2024.txt und klicken Sie auf Öffnen.
      4. Wählen Sie in der Liste Dateiformat die Option CSV aus.
      5. Geben Sie im Abschnitt Ziel im Feld Tabelle den Wert names_2024 ein.
      6. Klicken Sie im Abschnitt Schema auf die Ein/Aus-Schaltfläche Als Text bearbeiten und fügen Sie die folgende Schemadefinition in das Textfeld ein:
      7. name:string,assigned_sex_at_birth:string,count:integer
      8. Klicken Sie auf Tabelle erstellen.

        Warten Sie, bis BigQuery die Tabelle erstellt und die Daten geladen hat.

    Vorschau von Tabellendaten

    So lassen Sie die Tabellendaten in der Vorschau anzeigen:

    1. Maximieren Sie im Bereich Explorer Ihr Projekt und das Dataset babynames und wählen Sie die Tabelle names_2024 aus.
    2. Klicken Sie auf den Tab Vorschau. BigQuery zeigt die ersten Zeilen der Tabelle an.
    3. Tab „Tabellenvorschau“
    Der Tab Vorschau ist nicht für alle Tabellentypen verfügbar. Beispielsweise wird der Tab Vorschau nicht für externe Tabellen oder Ansichten angezeigt.

    Tabellendaten abfragen

    Fragen Sie als Nächstes die Tabelle ab.

    1. Klicken Sie neben dem Tab names_2024 auf die Option SQL-Abfrage. Ein neuer Editor-Tab wird geöffnet.
    2. Fügen Sie die folgende Abfrage in den Abfrageeditor ein. Mit dieser Abfrage werden die fünf beliebtesten Namen für Babys abgerufen, die 2024 in den USA geboren wurden und denen bei der Geburt das männliche Geschlecht zugewiesen wurde.
      
        SELECT
          name,
          count
        FROM
          `babynames.names_2024`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
    3. Klicken Sie auf Ausführen. Die Ergebnisse werden im Abschnitt Abfrageergebnisse angezeigt.
      Bereich „Abfrageergebnisse“

    Sie haben erfolgreich eine Tabelle in einem öffentlichen Dataset abgefragt und dann Ihre Beispieldaten mit der Google Cloud Console in BigQuery geladen.

    Bereinigen

    Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen in Rechnung gestellt werden:

    1. Öffnen Sie in der Google Cloud Console die Seite „BigQuery“.
    2. BigQuery aufrufen
    3. Klicken Sie im Bereich Explorer auf das von Ihnen erstellte Dataset babynames.
    4. Maximieren Sie die Option Aktionen ansehen und klicken Sie auf Löschen.
    5. Bestätigen Sie im Dialogfeld Dataset löschen den Löschbefehl: Geben Sie dafür das Wort delete ein und klicken Sie auf Löschen.

    Nächste Schritte