Öffentliche Google BigQuery-Datasets

Ein öffentliches Dataset ist ein Dataset, das in BigQuery gespeichert ist und der Allgemeinheit zugänglich gemacht wird. Die in der BigQuery-Dokumentation aufgelisteten öffentlichen Datasets sind Datasets, die Google BigQuery für Sie hostet, damit Sie darauf zugreifen und sie in Ihre Anwendungen integrieren können. Google bezahlt die Speicherung dieser Datensätze und bietet öffentlichen Zugriff auf die Daten über ein Projekt. Sie bezahlen nur für die Abfragen, die Sie mit den Daten durchführen (die ersten 1 TB pro Monat sind kostenlos, siehe Details der Abfragepreise).

So werden öffentliche Datasets mit BigQuery abgefragt

BigQuery ist eine vollständig verwaltete Data Warehouse- und Analyseplattform. Öffentliche Datasets lassen sich mit SQL-Abfragen analysieren. Sie können auf öffentliche BigQuery-Datasets über die Webbenutzeroberfläche, das Befehlszeilentool oder durch Aufrufe an die BigQuery REST API mit vielen Clientbibliotheken wie Java, .NET oder Python zugreifen.

Derzeit werden öffentliche BigQuery-Datasets am Standort US gespeichert, der mehrere Regionen umfasst. Wenn Sie ein öffentliches Dataset abfragen, geben Sie in der Befehlszeile das Flag --location=US an, wählen in der BigQuery-Webbenutzeroberfläche US als Verarbeitungsort aus oder geben bei Verwendung der API im Abschnitt jobReference der Jobressource die Property location an. Da die öffentlichen Datasets in den USA gespeichert werden, können Sie Abfrageergebnisse für öffentliche Daten nicht in eine Tabelle in einer anderen Region schreiben und Tabellen in öffentlichen Datasets nicht mit Tabellen in einer anderen Region zusammenführen.

Um ein öffentliches BigQuery-Dataset verwenden zu können, müssen Sie zuerst ein Projekt erstellen oder auswählen. Das erste pro Monat verarbeitete Terabyte Daten ist kostenlos, sodass Sie mit der Abfrage von öffentlichen Datasets beginnen können, ohne die Abrechnung zu aktivieren. Wenn Sie jedoch beabsichtigen, das kostenlose Kontingent zu überschreiten, sollten Sie die Abrechnung aktivieren.

  1. Melden Sie sich bei Ihrem Google-Konto an.

    Wenn Sie noch kein Konto haben, registrieren Sie sich hier für ein neues Konto.

  2. Wählen Sie ein GCP-Projekt aus oder erstellen Sie eines.

    Zur Seite "Ressourcen verwalten"

  3. Die Abrechnung für Ihr Projekt muss aktiviert sein.

    Informationen zum Aktivieren von Abrechnungen

  4. BigQuery ist in neuen Projekten automatisch aktiviert. So aktivieren Sie BigQuery in einem bereits vorhandenen Projekt, Aktivieren Sie die BigQuery API.

    Aktivieren Sie die API

Andere öffentliche Datasets

Es sind möglicherweise viele andere öffentliche Datasets vorhanden, die Sie abfragen können, einige dieser Datasets werden auch von Google gehostet, viele andere werden jedoch von Drittanbietern gehostet. Sie können jedes Ihrer Datasets mit der Allgemeinheit teilen, indem Sie die Freigabeberechtigungen für Ihr Dataset ändern. Weitere Informationen zum Freigeben von Datasets finden Sie unter Zugriffssteuerungen zu Datasets zuweisen.

Kontakt

Bei Fragen zum BigQuery-Programm öffentlicher Datasets kontaktieren Sie uns unter bq-public-data@google.com.

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit:

Feedback geben zu...