Sehen Sie sich die Sitzung zur Datenanalysestrategie und Roadmap von Google Cloud Next '21 on demand an.

Datasets

Optimieren Sie Ihre Analysen und KI-Initiativen mit vordefinierten Datenlösungen und wertvollen Datasets, basierend auf BigQuery, Cloud Storage, Earth Engine und anderen Google Cloud-Diensten. 

Datenumgebung erweitern

Erhöhen Sie den Wert Ihrer Daten-Assets, wenn Sie Ihre Analyse- oder KI-Initiativen durch externe Daten ergänzen. Entdecken Sie einzigartige, wertvolle Datasets und vordefinierte Lösungen von Google, öffentlichen oder kommerziellen Anbietern. Mit vollständig verwalteten Datenpipelines können Sie sich auf das konzentrieren, was für Sie am wichtigsten ist: Bereitstellung von Statistiken und Mehrwert für Ihr Unternehmen.

Weitere Informationen zu unseren öffentlichen Datasets

Kategorie Nützliche Datasets Beispielabfragen, Anwendungsfälle und Lösungen
Datasets von Google

Mit diesem Dataset können Sie die Top 25 und die Top 25 der aufsteigenden Suchanfragen aus Google Trends der letzten 30 Tage anzeigen. Jeder Zeitraum umfasst Verlaufsdaten aus fünf Jahren für die 210 Designated Market Areas (DMAs) in den USA.

  • check_circle_filled_black_24dp (1)

    Was steht bei den Hörern in meinem Nachrichten-/Radio-Sendegebiet im Vordergrund?

  • check_circle_filled_black_24dp (1)

    Welche sind die häufigsten Suchbegriffe in den USA aus den neuesten verfügbaren Daten?

  • check_circle_filled_black_24dp (1)

    Was sind die beliebtesten Einzelhandelsartikel, nach denen Menschen in der Region gesucht haben?

Mobilitätsberichte

Dieses Dataset soll Aufschluss darüber geben, was sich aufgrund von Richtlinien zur Bekämpfung von COVID-19 geändert hat. Es zeigt Bewegungstrends über einen längeren Zeitraum und nach Standorten verteilt und verteilt auf verschiedenen Ortskategorien wie Einzelhandel und Freizeit, Lebensmittel und Apotheken, Parks, Haltestellen, Arbeitsplätzen und Wohnhäusern.

  • check_circle_filled_black_24dp (1)

    Welche Auswirkungen hatte die Ausgangsbeschränkung von San Francisco auf Besuche im Einzelhandel?

  • check_circle_filled_black_24dp (1)

    Anwendungsfall: Anwendungsfall: Identifizierung der veränderten Besucherfrequenz im Einzelhandel an Wochenenden

Google Analytics (Beispiel)

Dieses Dataset bietet verschleierte Google Analytics 360-Daten aus einem Zeitraum von zwölf Monaten (August 2016 bis August 2017). Diese Daten stammen aus dem Google Merchandise Store, einem echten E-Commerce-Shop, in dem Merchandise-Artikel von Google verkauft werden. Die Daten sind typisch für eine E-Commerce-Website und umfassen Traffic-Quelldaten, Inhaltsdaten und Transaktionsdaten.

Forschung zur Google Patentsuche

Die Forschungsdaten der Google Patentsuche enthalten die Ergebnisse eines Großteils der Datenanalyse, die in der Google Patentsuche (patents.google.com) verwendet wird, einschließlich maschineller Übersetzungen von Titeln und Zusammenfassungen aus Google Translate, Einbettungsvektoren, extrahierten Top-Begriffen, ähnlichen Dokumenten und Vorwärtsreferenzen.

  • check_circle_filled_black_24dp (1)

    Welche sind die 20 letzten eingereichten Patente?

  • check_circle_filled_black_24dp (1)

    Welche Fortune 500-Unternehmen haben zwischen 2017 und 2019 aktiv Patente eingereicht?  

Öffentliche Datasets
Details zu schweren Sturmereignissen

Die Datenbank für Sturmereignisse ist eine integrierte Datenbank für Unwetterereignisse in den Vereinigten Staaten von 1950 bis heute mit Informationen zu Ort, Azimut, Entfernung, Auswirkung und Schweregrad eines Sturmereignisses, einschließlich der Schadenskosten an Gebäuden und in der Landwirtschaft.

  • check_circle_filled_black_24dp (1)

    Welche Stürme in den letzten 15 Jahren haben die meisten Sachschäden verursacht?

  • check_circle_filled_black_24dp (1)
  • check_circle_filled_black_24dp (1)

    Anwendungsfall: Baumarkt, der die Auswirkungen von Stürmen auf den Lagerbestand versteht

Census Bureau US-Grenzen

Hierbei handelt es sich um Grenzdateien in voller Auflösung, die von TIGER/Line Shapefiles abgeleitet werden. Dies sind die vollständig unterstützten grundlegenden geografischen Produkte des US Census Bureau. Dazu gehören Informationen für die 50 Bundesstaaten, den District of Columbia, Puerto Rico und die entlegenen Inselgebiete.

  • check_circle_filled_black_24dp (1)

    In welchen Städten in den USA liegen die meisten öffentlichen Flughäfen im Umkreis von 16 km von der Stadt?

  • check_circle_filled_black_24dp (1)

    Anwendungsfall: Entwicklung eines Urbanisierungsindex für Einzelhändler

American Community Survey

Die American Community Survey (ACS) ist eine fortlaufende Umfrage, die wichtige Informationen über die Nation und ihre Bevölkerung mit jährlich über 3,5 Millionen befragten Haushalten im ganzen Land bietet. Die daraus resultierenden Daten liefern unglaublich genaue demografische Informationen über die USA, die auf verschiedenen geografischen Ebenen aggregiert werden.

  • check_circle_filled_black_24dp (1)

    Wie hat sich der Anteil der Mieten am Durchschnittseinkommen im Vergleich zum Vorjahr verändert?  

  • check_circle_filled_black_24dp (1)

    Anwendungsfall: Bevölkerungswachstumstrends als Input für die Analyse der Anlagen-/Standortwahl

Alle öffentlichen Datasets

Suchen Sie nach und greifen Sie auf über 200 Datasets zu, die im Google Cloud Marketplace aufgeführt sind.

  • check_circle_filled_black_24dp (1)

    Welche Datasets können den Kontext für unsere Analysen- oder KI-Workflows vertiefen?

Kommerzielle Datasets
Crux Informatics

Crox Deliver ist ein verwalteter Dienst für Data Engineering und Datenvoränge. Crux verknüpft alle herkömmlichen und alternativen Datenanbieter im Namen seiner Kunden und verwaltet alle Aspekte der Onboarding, des Data Engineering und des Betriebs. Jedes Dataset wird validiert, damit wir nur ordnungsgemäße und umsetzbare Daten bereitstellen. 

  • check_circle_filled_black_24dp (1)

    Welche Datasets kann ich mit Crux in meine Datenumgebung einbinden?

HouseCanary

Direkter Zugriff auf zuverlässige Informationen zu Immobilien, Krediten und Wertungen für 100 Millionen Häuser. ML-Algorithmen verarbeiten Hunderte von Datenquellen, um für die Immobilienpreise für 381 Großräume, 18.300 Postleitzahlen und 4 Millionen Blöcke in der Region, die mehr als 95 % des US-amerikanischen Wohnmarktes abdecken, Indizes für Wohnimmobilien anzugeben. Investitionsentscheidungen auf der Grundlage von historischen Volatilitätsinformationen der letzten 400Jahre und Prognosen für 3 Jahre.

  • check_circle_filled_black_24dp (1)

    Für welche Postleitzahlen wird im nächsten Jahr ein Preisanstieg von 3 % oder mehr prognostiziert?

  • check_circle_filled_black_24dp (1)

    Was ist der Wert einer bestimmten Immobilie?

Earth Engine-Datasets
Earth Engine

Das öffentliche Datenarchiv von Earth Engine umfasst mehr als vierzig Jahre historischer Bilddaten und wissenschaftlicher Datasets, die täglich aktualisiert werden und für Online-Analysen zur Verfügung stehen.

  • check_circle_filled_black_24dp (1)

    Wie hat sich die Oberflächentemperatur in den letzten 30 Jahren verändert?

  • check_circle_filled_black_24dp (1)

    Wie sah dieses Gebiet vor dem Jahr 2000 aus?

Kaggle datasets
Kaggle datasets

In Kaggle finden Sie den gesamten Code und die Daten, die Sie für Ihre Data-Science-Aufgaben benötigen. Mit mehr als 80.000 öffentlichen Datasets und 400.000 öffentlichen Notebooks können Sie jede Analyse im Handumdrehen erledigen.

  • check_circle_filled_black_24dp (1)

    Können Sie einige der schwierigsten und anspruchsvollsten Probleme in der Data Science bewältigen?

Synthetische Datasets
Cymbal Investments

Die synthetischen Daten repräsentieren Transaktionen von automatisierten Handelsbots, die von der fiktiven Cymbal Investitions-Gruppe betrieben werden und jeweils einen einzigen Algorithmus zur Steuerung ihrer Handelsentscheidungen verwenden. Die Datensätze werden aus dem FIX-Protokoll (Version 4.4) der Trade Capture-Berichte  abgeleitet, die in BigQuery geladen werden. 

  • check_circle_filled_black_24dp (1)

    Wie viel haben die Händler mit jedem einzelnen Trade verdient?

Datasets recherchieren

Über die Google Datensatzsuche wurden fast 25 Millionen Datasets aus dem Web indexiert. So können Sie an einem zentralen Ort nach Datasets suchen und Links zum Speicherort der Daten finden. Sie können nach Aktualität, Format, Thema usw. filtern.

  • check_circle_filled_black_24dp (1)

    Welche Datasets gibt es für <Stichwort, das Sie interessiert>? 

  • check_circle_filled_black_24dp (1)

    Welche Nachhaltigkeits-Datasets aus dem Vorjahr sind für die kommerzielle Nutzung kostenlos?

Kategorie

Inspiriert? Gehen wir Ihre Herausforderungen gemeinsam an.

Erfahren Sie, wie Google Cloud Datasets die Art und Weise verändern, wie Ihr Unternehmen mit Daten und vorgefertigten Lösungen arbeitet.
Vertrieb kontaktieren
Wenn es ein öffentliches Dataset gibt, das Sie gerne eingebunden sehen möchten, wenden Sie sich bitte an public-data-help@google.com.

Mit der BigQuery-Sandbox können Sie die gesamte BigQuery-Funktionalität ohne Rechnungskonto oder Kreditkarte ausprobieren.

Datenpartner und Kundenberichte

Erfahren Sie mehr über beide Seiten der Dataset-Umgebung: Datenanbieter und Datennutzer.