Nehmen Sie an unserem Google Data Cloud & AI Summit 2023 teil und erfahren Sie mehr über die neuesten Innovationen in den Bereichen KI, Analysen, BI, Datenbanken und mehr.

Datasets

Optimieren Sie Ihre Analysen und KI-Initiativen mit vordefinierten Datenlösungen und wertvollen Datasets, basierend auf BigQuery, Cloud Storage, Earth Engine und anderen Google Cloud-Diensten. 

Datenumgebung erweitern

Erhöhen Sie den Wert Ihrer Daten-Assets, wenn Sie Ihre Analyse- oder KI-Initiativen durch externe Daten ergänzen. Entdecken Sie einzigartige, wertvolle Datasets und vordefinierte Lösungen von Google, öffentlichen oder kommerziellen Anbietern. Mit vollständig verwalteten Datenpipelines können Sie sich auf das konzentrieren, was für Sie am wichtigsten ist: Bereitstellung von Statistiken und Mehrwert für Ihr Unternehmen.

Weitere Informationen zu unseren öffentlichen Datasets

Kategorie Nützliche Datasets Beispiele für Anwendungsfälle und Erkenntnisse
Datasets von Google

Mit diesem Dataset können Sie die Top 25 und die Top 25 der aufsteigenden Suchanfragen aus Google Trends der letzten 30 Tage anzeigen. Jeder Zeitraum umfasst Verlaufsdaten aus fünf Jahren für die 210 Designated Market Areas (DMAs) in den USA und jetzt auch in mehr als 50 Ländern weltweit.

  • Was sind die beliebtesten Einzelhandelsartikel, nach denen Menschen in der Region gesucht haben?

Google Analytics (Beispiel)

Das Dataset enthält 12 Monate (August 2016 bis August 2017) an verschleierten Google Analytics 360-Daten aus dem Google Merchandise Store um zu zeigen, was eine E-Commerce-Website sehen würde. Dazu zählen Zugriffsquelle, Inhalt und Transaktionsdaten.

  • Wie hoch ist die Gesamtzahl der generierten Transaktionen pro Gerätebrowser?

Forschung zur Google Patentsuche

Die Forschungsdaten der Google Patentsuche enthalten die Ergebnisse eines Großteils der Datenanalyse, die in der Google Patentsuche (patents.google.com) verwendet wird, einschließlich maschineller Übersetzungen von Titeln und Zusammenfassungen aus Google Translate, Einbettungsvektoren, extrahierten Top-Begriffen, ähnlichen Dokumenten und Vorwärtsreferenzen.

  • Welche sind die 20 letzten eingereichten Patente?

Kommerzielle Datasets
Crux Informatics

Crux Deliver ist ein verwalteter Dienst für Data Engineering und Vorgänge. Crux verbindet alle herkömmlichen und alternativen Datenanbieter im Namen seiner Kunden und verwaltet alle Aspekte von Onboarding, Data Engineering und Betrieb. Jedes Dataset wird validiert, damit wir ausschließlich ordnungsgemäße und umsetzbare Daten bereitstellen.

  • Welche Datasets kann ich mit Crux in meine Datenumgebung einbinden?

Exchange Data International

Exchange Data International (EDI) hilft der globalen Finanz- und Investmentcommunity, fundierte Entscheidungen zu treffen. Die umfangreiche Inhaltsdatenbank von EDI umfasst Aktien- und Anlageaktionen weltweit, Dividenden, statische Referenzdaten, Schlusskurse und Aktien.

  • Historische Ereignisse verstehen, die sich auf Stammaktien und ETFs auswirken

Factset

FactSet ist ein globaler Anbieter integrierter Finanzinformationen, Analyseanwendungen und einem branchenführenden Dienst, der herausragende Inhalte, Analysen und flexible Technologie bietet.

  • Sie können mehrere Versionen von Fusionsvereinbarungen im Blick behalten und so Ihren Investitionsprozess verbessern.

HouseCanary

Direkter Zugriff auf zuverlässige Informationen zu Immobilien, Krediten und Wertungen für 100 Millionen Häuser. ML-Algorithmen verarbeiten Hunderte von Datenquellen, um für die Immobilienpreise für 381 Großräume, 18.300 Postleitzahlen und 4 Millionen Blöcke in der Region, die mehr als 95 % des US-amerikanischen Wohnmarktes abdecken, Indizes für Wohnimmobilien anzugeben. 

  • Treffen Sie Investitionsentscheidungen anhand von 40-jährigen historischen Volatilitätsinformationen oder einer Prognose für 3 Jahre.

LinkUp

LinkUp, der weltweit führende Anbieter von Arbeitsmarkt-Daten und -Analysen, die akkurat sind, in Echtzeit geliefert werden und Prognosezwecken dienen, bietet eigene Datenlösungen, mit denen Kunden wertvolle Erkenntnisse über den globalen Arbeitsmarkt gewinnen können und mit denen Investoren Alphaversionen auf Makro-, Sektor-, geografischer und individuelle Firma-ebene generieren können.

  • Erstellen Sie Modelle und Signale, um das Jobwachstum auf Sektorebene zu bewerten und vorherzusagen.

London Energy Brokers Association

Die LEBA-Lösung bietet Kunden die Möglichkeit, eine einzigartige, konsolidierte Ansicht der Energiemärkte über die wichtigsten Energiebroker hinweg zu erhalten. Energieerzeuger, Öl- und Gasproduzenten, Großhandel, Energieversorger und Finanzhändler profitieren von unabhängigen Marktinformationen basierend auf der Handelstätigkeit anstatt auf Preisauffassungen.

  • Verstehen Sie die Energiepreise in verschiedenen europäischen Ländern

Neustar

Neustar, Inc., ein TransUnion-Unternehmen, ist ein führender Anbieter von Identitätslösungen, die Daten und Technologie bereitstellen, die vertrauenswürdige Verbindungen zwischen Unternehmen und Personen in den entscheidenden Momenten ermöglichen. Neustar bietet branchenführende Lösungen in den Bereichen Marketing, Risiko und Kommunikation.

  • Kundendaten-Assets verbessern und datenschutzorientierte Verbraucherdatenbanken erstellen

RS Metrics

RS Metrics, das führende Unternehmen für objektive und nachprüfbare Echtzeit-Daten zu Umwelt, Soziales und Governance auf Asset-Ebene bieten Kunden die Möglichkeit, auf genaue Erkenntnisse zuzugreifen was die Fabrik-Inventarebenen von Elektrofahrzeugherstellern angeht.

  • Erstellen Sie unabhängige, überprüfbare und objektive Benchmarks für die Produktion von Elektrofahrzeugen.

Ursa Space Systems

Ursa Space Systems, ein globaler Anbieter von Infrastruktur für Satellitenüberwachung, bietet Kunden die Möglichkeit, globale wirtschaftliche Trends mit Daten zu verfolgen, die aus Satellitenbildern abgeleitet werden und jede Woche aktualisiert werden.

  • Wie werden sich wahrscheinlich die Benchmarks und die regionale Verteilung der Ölpreise entwickeln?

Öffentliche Datasets
Details zu schweren Sturmereignissen

Die Datenbank für Sturmereignisse ist eine integrierte Datenbank für Unwetterereignisse in den Vereinigten Staaten von 1950 bis heute mit Informationen zu Ort, Azimut, Entfernung, Auswirkung und Schweregrad eines Sturmereignisses, einschließlich der Schadenskosten an Gebäuden und in der Landwirtschaft.

Census Bureau US-Grenzen

Hierbei handelt es sich um Grenzdateien in voller Auflösung, die von TIGER/Line Shapefiles abgeleitet werden. Dies sind die vollständig unterstützten grundlegenden geografischen Produkte des US Census Bureau. Dazu gehören Informationen für die 50 Bundesstaaten, den District of Columbia, Puerto Rico und die entlegenen Inselgebiete.

  • Anwendungsfall: Entwicklung eines Urbanisierungsindex für Einzelhändler

American Community Survey

Die American Community Survey (ACS) ist eine fortlaufende Umfrage, die wichtige Informationen über die Nation und ihre Bevölkerung mit jährlich über 3,5 Millionen befragten Haushalten im ganzen Land bietet. Die daraus resultierenden Daten liefern unglaublich genaue demografische Informationen über die USA, die auf verschiedenen geografischen Ebenen aggregiert werden.

  • Anwendungsfall: Bevölkerungswachstumstrends als Input für die Analyse der Anlagen-/Standortwahl

Alle öffentlichen Datasets

Suchen Sie nach und greifen Sie auf über 200 Datasets zu, die im Google Cloud Marketplace aufgeführt sind.

  • Welche Datasets können den Kontext für unsere Analysen- oder KI-Workflows vertiefen?

Earth Engine-Datasets
Earth Engine

Das öffentliche Datenarchiv von Earth Engine umfasst mehr als vierzig Jahre historischer Bilddaten und wissenschaftlicher Datasets, die täglich aktualisiert werden und für Online-Analysen zur Verfügung stehen.

  • Wie hat sich die Oberflächentemperatur in den letzten 30 Jahren verändert?

  • Wie sah dieses Gebiet vor dem Jahr 2000 aus?

Kaggle datasets
Kaggle Datasets

In Kaggle finden Sie den gesamten Code und die Daten, die Sie für Ihre Data-Science-Aufgaben benötigen. Mit mehr als 80.000 öffentlichen Datasets und 400.000 öffentlichen Notebooks können Sie jede Analyse im Handumdrehen erledigen.

  • Können Sie einige der schwierigsten und anspruchsvollsten Probleme in der Data Science bewältigen?

Synthetische Datasets
Cymbal Investments

Die synthetischen Daten repräsentieren Transaktionen von automatisierten Handelsbots, die von der fiktiven Cymbal Investitions-Gruppe betrieben werden und jeweils einen einzigen Algorithmus zur Steuerung ihrer Handelsentscheidungen verwenden. Die Datensätze werden aus dem FIX-Protokoll (Version 4.4) der Trade Capture-Berichte  abgeleitet, die in BigQuery geladen werden. 

  • Wie viel haben die Händler mit jedem einzelnen Trade verdient?

Datasets recherchieren

Über die Google Datensatzsuche wurden fast 25 Millionen Datasets aus dem Web indexiert. So können Sie an einem zentralen Ort nach Datasets suchen und Links zum Speicherort der Daten finden. Sie können nach Aktualität, Format, Thema usw. filtern.

  • Welche Datasets gibt es für <Stichwort, das Sie interessiert>? 

  • Welche Nachhaltigkeits-Datasets aus dem Vorjahr sind für die kommerzielle Nutzung kostenlos?

Mit diesem Dataset können Sie die Top 25 und die Top 25 der aufsteigenden Suchanfragen aus Google Trends der letzten 30 Tage anzeigen. Jeder Zeitraum umfasst Verlaufsdaten aus fünf Jahren für die 210 Designated Market Areas (DMAs) in den USA und jetzt auch in mehr als 50 Ländern weltweit.

  • Was sind die beliebtesten Einzelhandelsartikel, nach denen Menschen in der Region gesucht haben?

Google Analytics (Beispiel)

Das Dataset enthält 12 Monate (August 2016 bis August 2017) an verschleierten Google Analytics 360-Daten aus dem Google Merchandise Store um zu zeigen, was eine E-Commerce-Website sehen würde. Dazu zählen Zugriffsquelle, Inhalt und Transaktionsdaten.

  • Wie hoch ist die Gesamtzahl der generierten Transaktionen pro Gerätebrowser?

Forschung zur Google Patentsuche

Die Forschungsdaten der Google Patentsuche enthalten die Ergebnisse eines Großteils der Datenanalyse, die in der Google Patentsuche (patents.google.com) verwendet wird, einschließlich maschineller Übersetzungen von Titeln und Zusammenfassungen aus Google Translate, Einbettungsvektoren, extrahierten Top-Begriffen, ähnlichen Dokumenten und Vorwärtsreferenzen.

  • Welche sind die 20 letzten eingereichten Patente?

Crux Informatics

Crux Deliver ist ein verwalteter Dienst für Data Engineering und Vorgänge. Crux verbindet alle herkömmlichen und alternativen Datenanbieter im Namen seiner Kunden und verwaltet alle Aspekte von Onboarding, Data Engineering und Betrieb. Jedes Dataset wird validiert, damit wir ausschließlich ordnungsgemäße und umsetzbare Daten bereitstellen.

  • Welche Datasets kann ich mit Crux in meine Datenumgebung einbinden?

Exchange Data International

Exchange Data International (EDI) hilft der globalen Finanz- und Investmentcommunity, fundierte Entscheidungen zu treffen. Die umfangreiche Inhaltsdatenbank von EDI umfasst Aktien- und Anlageaktionen weltweit, Dividenden, statische Referenzdaten, Schlusskurse und Aktien.

  • Historische Ereignisse verstehen, die sich auf Stammaktien und ETFs auswirken

Factset

FactSet ist ein globaler Anbieter integrierter Finanzinformationen, Analyseanwendungen und einem branchenführenden Dienst, der herausragende Inhalte, Analysen und flexible Technologie bietet.

  • Sie können mehrere Versionen von Fusionsvereinbarungen im Blick behalten und so Ihren Investitionsprozess verbessern.

HouseCanary

Direkter Zugriff auf zuverlässige Informationen zu Immobilien, Krediten und Wertungen für 100 Millionen Häuser. ML-Algorithmen verarbeiten Hunderte von Datenquellen, um für die Immobilienpreise für 381 Großräume, 18.300 Postleitzahlen und 4 Millionen Blöcke in der Region, die mehr als 95 % des US-amerikanischen Wohnmarktes abdecken, Indizes für Wohnimmobilien anzugeben.

  • Treffen Sie Investitionsentscheidungen anhand von 40-jährigen historischen Volatilitätsinformationen oder einer Prognose für 3 Jahre.

LinkUp

LinkUp, der weltweit führende Anbieter von Arbeitsmarkt-Daten und -Analysen, die akkurat sind, in Echtzeit geliefert werden und Prognosezwecken dienen, bietet eigene Datenlösungen, mit denen Kunden wertvolle Erkenntnisse über den globalen Arbeitsmarkt gewinnen können und mit denen Investoren Alphaversionen auf Makro-, Sektor-, geografischer und individuelle Firma-ebene generieren können.

  • Erstellen Sie Modelle und Signale, um das Jobwachstum auf Sektorebene zu bewerten und vorherzusagen.

London Energy Brokers Association

Die LEBA-Lösung bietet Kunden die Möglichkeit, eine einzigartige, konsolidierte Ansicht der Energiemärkte über die wichtigsten Energiebroker hinweg zu erhalten. Energieerzeuger, Öl- und Gasproduzenten, Großhandel, Energieversorger und Finanzhändler profitieren von unabhängigen Marktinformationen basierend auf der Handelstätigkeit anstatt auf Preisauffassungen.

  • Verstehen Sie die Energiepreise in verschiedenen europäischen Ländern

Neustar

Neustar, Inc., ein TransUnion-Unternehmen, ist ein führender Anbieter von Identitätslösungen, die Daten und Technologie bereitstellen, die vertrauenswürdige Verbindungen zwischen Unternehmen und Personen in den entscheidenden Momenten ermöglichen. Neustar bietet branchenführende Lösungen in den Bereichen Marketing, Risiko und Kommunikation.

  • Kundendaten-Assets verbessern und datenschutzorientierte Verbraucherdatenbanken erstellen

RS Metrics

RS Metrics, das führende Unternehmen für objektive und nachprüfbare Echtzeit-Daten zu Umwelt, Soziales und Governance auf Asset-Ebene bieten Kunden die Möglichkeit, auf genaue Erkenntnisse zuzugreifen was die Fabrik-Inventarebenen von Elektrofahrzeugherstellern angeht.

  • Erstellen Sie unabhängige, überprüfbare und objektive Benchmarks für die Produktion von Elektrofahrzeugen.

Ursa Space Systems

Ursa Space Systems, ein globaler Anbieter von Infrastruktur für Satellitenüberwachung, bietet Kunden die Möglichkeit, globale wirtschaftliche Trends mit Daten zu verfolgen, die aus Satellitenbildern abgeleitet werden und jede Woche aktualisiert werden.

  • Wie werden sich wahrscheinlich die Benchmarks und die regionale Verteilung der Ölpreise entwickeln?

Details zu schweren Sturmereignissen

Die Datenbank für Sturmereignisse ist eine integrierte Datenbank für Unwetterereignisse in den Vereinigten Staaten von 1950 bis heute mit Informationen zu Ort, Azimut, Entfernung, Auswirkung und Schweregrad eines Sturmereignisses, einschließlich der Schadenskosten an Gebäuden und in der Landwirtschaft.

Census Bureau US-Grenzen

Hierbei handelt es sich um Grenzdateien in voller Auflösung, die von TIGER/Line Shapefiles abgeleitet werden. Dies sind die vollständig unterstützten grundlegenden geografischen Produkte des US Census Bureau. Dazu gehören Informationen für die 50 Bundesstaaten, den District of Columbia, Puerto Rico und die entlegenen Inselgebiete.

  • Anwendungsfall: Entwicklung eines Urbanisierungsindex für Einzelhändler

American Community Survey

Die American Community Survey (ACS) ist eine fortlaufende Umfrage, die wichtige Informationen über die Nation und ihre Bevölkerung mit jährlich über 3,5 Millionen befragten Haushalten im ganzen Land bietet. Die daraus resultierenden Daten liefern unglaublich genaue demografische Informationen über die USA, die auf verschiedenen geografischen Ebenen aggregiert werden.

  • Anwendungsfall: Bevölkerungswachstumstrends als Input für die Analyse der Anlagen-/Standortwahl

Alle öffentlichen Datasets

Suchen Sie nach und greifen Sie auf über 200 Datasets zu, die im Google Cloud Marketplace aufgeführt sind.

  • Welche Datasets können den Kontext für unsere Analysen- oder KI-Workflows vertiefen?

Earth Engine

Das öffentliche Datenarchiv von Earth Engine umfasst mehr als vierzig Jahre historischer Bilddaten und wissenschaftlicher Datasets, die täglich aktualisiert werden und für Online-Analysen zur Verfügung stehen.

  • Wie hat sich die Oberflächentemperatur in den letzten 30 Jahren verändert?

  • Wie sah dieses Gebiet vor dem Jahr 2000 aus?

Kaggle Datasets

In Kaggle finden Sie den gesamten Code und die Daten, die Sie für Ihre Data-Science-Aufgaben benötigen. Mit über 80.000 öffentlichen Datasets und 400.000 öffentlichen Notebooks können Sie im Handumdrehen beliebige Analysen bewältigen.

  • Können Sie einige der schwierigsten und anspruchsvollsten Probleme in der Data Science bewältigen?

Cymbal Investments

Die synthetischen Daten repräsentieren Transaktionen von automatisierten Handelsbots, die von der fiktiven Cymbal Investitions-Gruppe betrieben werden und jeweils einen einzigen Algorithmus zur Steuerung ihrer Handelsentscheidungen verwenden. Die Datensätze werden aus dem FIX-Protokoll (Version 4.4) der Trade Capture-Berichte  abgeleitet, die in BigQuery geladen werden. 

  • Wie viel haben die Händler mit jedem einzelnen Trade verdient?

Datensatzsuche

Über die Google Datensatzsuche wurden fast 25 Millionen Datasets aus dem Web indexiert. So können Sie an einem zentralen Ort nach Datasets suchen und Links zum Speicherort der Daten finden. Sie können nach Aktualität, Format, Thema usw. filtern.

  • Welche Datasets gibt es für <Stichwort, das Sie interessiert>? 

  • Welche Nachhaltigkeits-Datasets aus dem Vorjahr sind für die kommerzielle Nutzung kostenlos?

Inspiriert? Gehen wir Ihre Herausforderungen gemeinsam an.

Erfahren Sie, wie Google Cloud Datasets die Art und Weise verändern, wie Ihr Unternehmen mit Daten und vorgefertigten Lösungen arbeitet.
Vertrieb kontaktieren
Wenn es ein öffentliches Dataset gibt, das Sie gerne eingebunden sehen möchten, wenden Sie sich bitte an public-data-help@google.com.

Mit der BigQuery-Sandbox können Sie die gesamte BigQuery-Funktionalität ohne Rechnungskonto oder Kreditkarte ausprobieren.

Datenpartner und Kundenberichte

Erfahren Sie mehr über beide Seiten der Dataset-Umgebung: Datenanbieter und Datennutzer.