Öffentliches Dataset mit dem bq-Tool abfragen
Öffentliches Dataset mit dem bq-Befehlszeilentool untersuchen und abfragen.
Klicken Sie auf Anleitung, um eine detaillierte Anleitung für diese Aufgabe direkt in der Google Cloud -Konsole aufzurufen:
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
Die BigQuery API muss aktiviert sein.
Wenn Sie ein neues Projekt erstellt haben, wird die BigQuery API automatisch aktiviert.
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
Wenn Sie die Abrechnung für das Google Cloud -Projekt, das Sie in dieser Anleitung verwenden, nicht aktivieren, arbeiten Sie mit Daten in der BigQuery-Sandbox. Mit der BigQuery-Sandbox können Sie BigQuery mit einer begrenzten Anzahl von BigQuery-Features kostenlos nutzen.
Öffentliches Dataset untersuchen
BigQuery bietet mehrere Beispieltabellen im Dataset bigquery-public-data.samples
, die Sie abfragen können. In dieser Anleitung führen Sie Abfragen für die Tabelle shakespeare
aus, die einen Eintrag für jedes Wort in jedem Shakespeare-Stück enthält.
Sehen Sie sich die Tabelle shakespeare
im Dataset samples
an:
bq show bigquery-public-data:samples.shakespeare
Die entsprechende Ausgabe sieht etwa so aus: Einige Spalten werden weggelassen, um die Ausgabe zu vereinfachen.
Last modified Schema Total Rows Total Bytes
----------------- ------------------------------------ ------------ ------------
14 Mar 17:16:45 |- word: string (required) 164656 6432064
|- word_count: integer (required)
|- corpus: string (required)
|- corpus_date: integer (required)
Öffentliches Dataset abfragen
Führen Sie mit dem Befehl bq query
SQL-Abfragen für Daten aus.
Bestimmen Sie, wie oft der Teilstring
raisin
in Shakespeares Werken vorkommt:bq query --use_legacy_sql=false \ 'SELECT word, SUM(word_count) AS count FROM `bigquery-public-data.samples.shakespeare` WHERE word LIKE "%raisin%" GROUP BY word;'
Die Ausgabe sieht etwa so aus:
+---------------+-------+ | word | count | +---------------+-------+ | praising | 8 | | Praising | 4 | | raising | 5 | | dispraising | 2 | | dispraisingly | 1 | | raisins | 1 | +---------------+-------+
Suchen Sie in Shakespeares Werken den Teilstring
huzzah
:bq query --use_legacy_sql=false \ 'SELECT word FROM `bigquery-public-data.samples.shakespeare` WHERE word = "huzzah";'
Da der Teilstring in den Werken von Shakespeare nicht vorkommt, werden keine Ergebnisse zurückgegeben.
Bereinigen
Löschen Sie das Google Cloud -Projekt mit den Ressourcen, damit Ihrem Google Cloud -Konto die auf dieser Seite verwendeten Ressourcen nicht in Rechnung gestellt werden.
Projekt löschen
Wenn Sie das öffentliche Dataset mit der BigQuery-Sandbox abgefragt haben, ist die Abrechnung für Ihr Projekt nicht aktiviert.Am einfachsten vermeiden Sie weitere Kosten durch Löschen des für die Anleitung erstellten Projekts.
So löschen Sie das Projekt:
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Nächste Schritte
- Weitere Informationen zur Verwendung des bq-Tools.
- Weitere Informationen zur BigQuery-Sandbox
- Weitere Informationen zu öffentlichen BigQuery-Datasets
- Weitere Informationen zum Laden von Daten in BigQuery
- Weitere Informationen zum Abfragen von Daten in BigQuery
- Updates zu BigQuery erhalten
- Informationen zu BigQuery-Preisen
- BigQuery-Kontingente und -Limits