Retrouvez-nous au Google Data Cloud & AI Summit 2023 pour découvrir les dernières innovations en matière d'IA, d'analyse, d'informatique décisionnelle, de bases de données et plus encore.

Ensembles de données

Améliorez vos initiatives d'analyse et d'IA avec des solutions de données prédéfinies et des ensembles de données stratégiques basés sur BigQuery, Cloud Storage, Earth Engine et d'autres services Google Cloud.

Développez votre écosystème de données

Augmentez la valeur de vos éléments de données en augmentant vos initiatives d'analyse ou d'IA avec des données externes. Découvrez et consultez des ensembles de données uniques et intéressants, ainsi que des solutions prédéfinies par Google, des fournisseurs publics ou des fournisseurs. Avec des pipelines de données entièrement gérés, vous pouvez vous concentrer sur l'essentiel : fournir des insights et une valeur commerciale.

En savoir plus sur nos ensembles de données publics

Catégorie Sélection d'ensembles de données Exemples de cas d'utilisation et d'insights
Ensembles de données Google

Consultez les 25 requêtes les plus populaires et les 25 en hausse de Google Trends au cours des 30 derniers jours avec cet ensemble de données. Chaque terme inclut cinq ans de données historiques dans les 210 zones de marché désignées des États-Unis, et plus de 50 pays à travers le monde.

  • Quels sont les articles de détail les plus populaires que les internautes ont recherchés dans la région ?

Google Analytics (exemple)

Cet ensemble de données offre 12 mois (août 2016 à août 2017) de données Google Analytics 360 masquées provenant du Google Merchandise Store, pour montrer les informations visibles par un site d'e-commerce, y compris la source de trafic, le contenu et les données transactionnelles.

  • Quel est le nombre total de transactions générées par navigateur d'appareil ?

Recherche sur Google Brevets

Ces données contiennent la sortie de la majeure partie du travail d'analyse des données utilisé dans Google Brevets (patents.google.com), y compris la traduction automatique des titres et des extraits de Google Traduction, ou vecteurs de représentation vectorielle continue, termes populaires extraits, documents similaires et références de transfert.

  • Quels sont les 20 brevets les plus récemment déposés ?

Ensembles de données commerciaux
Crux Informatics

Crux Delivery est un service géré conçu pour l'ingénierie et les opérations des données. Crux délivre tous les fournisseurs de données traditionnels et alternatifs pour le compte de ses clients, et gère tous les aspects de l'intégration, de l'ingénierie des données et des opérations. Chaque ensemble de données est validé, afin de ne pouvoir fournir que des données propres et exploitables.

  • Quels ensembles de données Crux peut-il m'aider à intégrer à mon écosystème de données ?

Exchange Data International

Exchange Data International (EDI) aide la communauté mondiale de la finance et de l'investissement à prendre des décisions éclairées. La vaste base de données d'EDI comprend les opérations commerciales sur des actions et des titres à revenu fixe du monde entier, des dividendes, des données de référence statiques, des cours de clôture et des actions en circulation.

  • Comprenez les événements historiques qui affectent les actions et les ETF.

Factset

FactSet est un fournisseur mondial qui offre des informations financières intégrées, des applications d'analyse et un service de pointe proposant des contenus, des analyses et des technologies flexibles de haute qualité.

  • Suivez plusieurs versions des accords de fusion pour améliorer votre processus d'investissement.

HouseCanary

Accès instantané à des informations fiables sur les biens, les prêts et la valeur pour 100 millions de maisons. Les algorithmes de ML traitent des centaines de sources de données afin de fournir des indices de prix d'habitation pour 381 agglomérations, 18 300 codes postaux et 4 millions de blocs couvrant plus de 95 % du marché résidentiel américain. 

  • Prenez des décisions d'investissement grâce à des informations historiques liées aux fluctuations sur 40 ans et à des prévisions sur trois ans.

LinkUp

LinkUp, le leader international en matière de données et d'analyses précises, prédictives et en temps réel sur le marché de l'emploi, offre des solutions de données propriétaires qui permettent aux clients de dégager des insights utiles sur le marché mondial de l'emploi et d'aider les investisseurs à générer de l'alpha au niveau macro, sectoriel et géographique, ainsi qu'à l'échelle des entreprises individuelles.

  • Créez des modèles et des signaux pour évaluer et prédire la croissance de l'emploi au sein du secteur.

London Energy Brokers Association

LEBA offre une solution qui permet aux clients d'accéder à une vue unique et consolidée des marchés énergétiques par l'intermédiaire des principaux courtiers en énergie. Les producteurs d'énergie, de pétrole et de gaz, les utilisateurs en gros, les services publics et les investisseurs financiers bénéficient d'informations de marché indépendantes basées sur l'activité négociée plutôt que sur des évaluations de prix.

  • Comprenez les prix de l'énergie dans les différents pays d'Europe.

Neustar

Neustar Inc., une entreprise de TransUnion, est un leader dans le domaine de la résolution des identités, qui fournit les données et la technologie nécessaires pour permettre des connexions fiables entre les entreprises et les personnes aux moments les plus importants. Neustar offre des solutions de pointe dans le domaine du marketing, des risques et de la communication.

  • Améliorez les éléments de données client et créez des bases de données grand public axées sur la confidentialité.

RS Metrics

RS Metrics, le leader des données ESG en temps réel, objectives et vérifiables au niveau des ressources, permet aux clients d'accéder à des insights précis sur les niveaux d'inventaire des usines des fabricants de VE.

  • Créez des benchmarks indépendants, vérifiables et objectifs pour la production de véhicules électriques.

Ursa Space Systems

Ursa Space Systems, fournisseur mondial d'infrastructure d'intelligence satellite, permet à ses clients de surveiller les tendances économiques mondiales grâce à des données dérivées des images satellite mises à jour chaque semaine.

  • Quelle est l'évolution probable des prix du pétrole et des spreads régionaux ?

Ensembles de données publics
Détails de l'événement de tempête majeure

La base de données sur les tempêtes est une base de données intégrée qui regroupe les événements météorologiques violents aux États-Unis de 1950 à cette année. Elle contient des informations sur l'emplacement, l'azimut, la distance, l'impact et la gravité d'une tempête, y compris le coût des dommages matériels et agricoles.

Limites du Bureau de recensement des États-Unis

Il s'agit de fichiers de limites en résolution maximale, dérivés de TIGER/Line Shapefiles, les principaux produits géographiques pris en charge par le Bureau du recensement des États-Unis. Ils incluent des informations sur les 50 = États, le District de Columbia, Porto Rico et les régions insulaires périphériques.

  • Cas d'utilisation : développer un index d'urbanisation pour les marchands

American Community Survey

L'American Community Survey (ACS) est une enquête continue qui fournit des informations essentielles chaque année sur les États-Unis et ses habitants en contactant plus de 3,5 millions de foyers de tout le pays. Les données obtenues fournissent des données démographiques extrêmement détaillées sur les États-Unis, à différents niveaux géographiques.

  • Cas d'utilisation : tendances de la croissance de la population comme entrées pour l'analyse de la sélection d'installations/de sites

Tous les ensembles de données publics

Recherchez et accédez à plus de 200 ensembles de données répertoriés dans Google Cloud Marketplace.

  • Quels ensembles de données peuvent fournir un contexte plus approfondi pour nos workflows d'analyse ou d'IA ?

Ensembles de données Earth Engine
Earth Engine

Les archives de données publiques d'Earth Engine incluent plus de 40 ans d'images historiques et d'ensembles de données scientifiques, mises à jour quotidiennement et disponibles pour une analyse en ligne.

  • Comment la température de surface a-t-elle évolué au cours des 30 dernières années ?

  • À quoi ressemblait cette zone avant 2000 ?

Ensembles de données Kaggle
Ensembles de données Kaggle

Dans Kaggle, vous trouverez tous les codes et données dont vous avez besoin pour vos travaux de science des données. Utilisez plus de 80 000 ensembles de données publics et 400 000 notebooks publics pour mener une analyse en un rien de temps.

  • Saurez-vous aborder les problèmes les plus contradictoires et provocateurs en science des données ?

Ensembles de données synthétiques
Cymbal Investments

Les données synthétiques représentent les transactions des bots automatisés exploités par le groupe fictif Cymbal Investments, chacun utilisant un seul algorithme pour guider ses décisions commerciales. Les enregistrements sont issus des rapports Trade Capture du protocole FIX (version 4.4) chargés dans BigQuery.

  • Combien les vendeurs ont-ils gagné à partir de chaque échange individuel ?

Rechercher des ensembles de données

Le programme Google de recherche d'ensembles de données a indexé près de 25 millions d'ensembles de données sur le Web, ce qui vous permet de rechercher des ensembles de données au même endroit et de trouver des liens vers ceux-ci. Filtrez par récence, format, thème, etc.

  • Quels ensembles de données concernant <mot clé qui vous intéresse> existe-t-il ?

  • Quels ensembles de données durables l'année dernière sont-ils gratuits pour l'utilisation commerciale ?

Consultez les 25 requêtes les plus populaires et les 25 en hausse de Google Trends au cours des 30 derniers jours avec cet ensemble de données. Chaque terme inclut cinq ans de données historiques dans les 210 zones de marché désignées des États-Unis, et désormais de plus de 50 pays à travers le monde.

  • Quels sont les articles de détail les plus populaires que les internautes ont recherchés dans la région ?

Google Analytics (exemple)

Cet ensemble de données offre 12 mois (août 2016 à août 2017) de données Google Analytics 360 masquées provenant du Google Merchandise Store, pour montrer les informations visibles par un site d'e-commerce, y compris la source de trafic, le contenu et les données transactionnelles.

  • Quel est le nombre total de transactions générées par navigateur d'appareil ?

Recherche sur Google Brevets

Ces données contiennent la sortie de la majeure partie du travail d'analyse des données utilisé dans Google Brevets (patents.google.com), y compris la traduction automatique des titres et des extraits par Google Traduction, les vecteurs de représentation vectorielle continue, les termes populaires extraits, les documents similaires et les références de transfert.

  • Quels sont les 20 brevets les plus récemment déposés ?

Crux Informatics

Crux Delivery est un service géré conçu pour l'ingénierie et les opérations des données. Crux connecte tous les fournisseurs de données traditionnels et alternatifs pour le compte de ses clients, et gère tous les aspects de l'intégration, de l'ingénierie des données et des opérations. Chaque ensemble de données est validé, afin de fournir uniquement des données propres et exploitables.

  • Quels ensembles de données Crux peut-il m'aider à intégrer à mon écosystème de données ?

Exchange Data International

Exchange Data International (EDI) aide la communauté mondiale de la finance et de l'investissement à prendre des décisions éclairées. La vaste base de données d'EDI comprend les opérations commerciales sur des actions et des titres à revenu fixe du monde entier, des dividendes, des données de référence statiques, des cours de clôture et des actions en circulation.

  • Comprenez les événements historiques qui affectent les actions et les ETF.

Factset

FactSet est un fournisseur mondial qui offre des informations financières intégrées, des applications d'analyse et un service de pointe proposant des contenus, des analyses et des technologies flexibles de haute qualité.

  • Suivez plusieurs versions des accords de fusion pour améliorer votre processus d'investissement.

HouseCanary

Accès instantané à des informations fiables sur les biens, les prêts et la valeur pour 100 millions de maisons. Les algorithmes de ML traitent des centaines de sources de données afin de fournir des indices de prix d'habitation pour 381 agglomérations, 18 300 codes postaux et 4 millions de quartiers couvrant plus de 95 % du marché résidentiel américain.

  • Prenez des décisions d'investissement grâce à des informations historiques liées aux fluctuations sur 40 ans et à des prévisions sur trois ans.

LinkUp

LinkUp, le leader international en matière de données et d'analyses précises, prédictives et en temps réel sur le marché de l'emploi, offre des solutions de données propriétaires qui permettent aux clients de dégager des insights utiles sur le marché mondial de l'emploi et d'aider les investisseurs à générer des indicateurs alpha au niveau macro, sectoriel et géographique, ainsi qu'à l'échelle des entreprises individuelles.

  • Créez des modèles et des signaux pour évaluer et prédire la croissance de l'emploi au sein du secteur.

London Energy Brokers Association

LEBA offre une solution qui permet aux clients d'accéder à une vue unique et consolidée des marchés énergétiques par l'intermédiaire des principaux courtiers en énergie. Les producteurs d'énergie, de pétrole et de gaz, les utilisateurs en gros, les services publics et les investisseurs financiers bénéficient d'informations de marché indépendantes basées sur l'activité négociée plutôt que sur des évaluations de prix.

  • Comprenez les prix de l'énergie dans les différents pays d'Europe.

Neustar

Neustar Inc., une entreprise de TransUnion, est un leader dans le domaine de la résolution des identités, qui fournit les données et la technologie nécessaires pour permettre des connexions fiables entre les entreprises et les personnes aux moments les plus importants. Neustar offre des solutions de pointe dans le domaine du marketing, des risques et de la communication.

  • Améliorez les éléments de données client et créez des bases de données grand public axées sur la confidentialité.

RS Metrics

RS Metrics, le leader des données ESG en temps réel, objectives et vérifiables au niveau des ressources, permet aux clients d'accéder à des insights précis sur les niveaux d'inventaire des usines des fabricants de VE.

  • Créez des benchmarks indépendants, vérifiables et objectifs pour la production de véhicules électriques.

Ursa Space Systems

Ursa Space Systems, fournisseur mondial d'infrastructure d'intelligence satellite, permet à ses clients de surveiller les tendances économiques mondiales grâce à des données dérivées des images satellite mises à jour chaque semaine.

  • Quelle est l'évolution probable des prix du pétrole et des spreads régionaux ?

Détails de l'événement de tempête majeure

La base de données sur les tempêtes est une base de données intégrée qui regroupe les événements météorologiques violents aux États-Unis de 1950 à cette année. Elle contient des informations sur l'emplacement, l'azimut, la distance, l'impact et la gravité d'une tempête, y compris le coût des dommages matériels et agricoles.

Limites du Bureau de recensement des États-Unis

Il s'agit de fichiers de limites en résolution maximale, dérivés de TIGER/Line Shapefiles, les principaux produits géographiques pris en charge par le Bureau du recensement des États-Unis. Ils incluent des informations sur les 50 États, le District de Columbia, Porto Rico et les régions insulaires périphériques.

  • Cas d'utilisation : développer un index d'urbanisation pour les marchands

American Community Survey

L'American Community Survey (ACS) est une enquête continue qui fournit des informations essentielles chaque année sur les États-Unis et ses habitants en contactant plus de 3,5 millions de foyers dans tout le pays. Les données obtenues fournissent des données démographiques extrêmement détaillées sur les États-Unis, à différents niveaux géographiques.

  • Cas d'utilisation : tendances de la croissance de la population comme entrées pour l'analyse de la sélection d'installations/de sites

Tous les ensembles de données publics

Recherchez et accédez à plus de 200 ensembles de données répertoriés dans Google Cloud Marketplace.

  • Quels ensembles de données peuvent fournir un contexte plus approfondi pour nos workflows d'analyse ou d'IA ?

Earth Engine

Les archives de données publiques d'Earth Engine incluent plus de 40 ans d'images historiques et d'ensembles de données scientifiques, mises à jour quotidiennement et disponibles pour une analyse en ligne.

  • Comment la température de surface a-t-elle évolué au cours des 30 dernières années ?

  • À quoi ressemblait cette zone avant 2000 ?

Ensembles de données Kaggle

Dans Kaggle, vous trouverez tous les codes et données dont vous avez besoin pour vos travaux de science des données. Utilisez plus de 80 000 ensembles de données publics et 400 000 notebooks publics pour mener une analyse en un rien de temps.

  • Saurez-vous aborder les problèmes les plus contradictoires et provocateurs en science des données ?

Cymbal Investments

Les données synthétiques représentent les transactions des bots automatisés exploités par le groupe fictif Cymbal Investments, chacun utilisant un seul algorithme pour guider ses décisions commerciales. Les enregistrements sont issus des rapports Trade Capture du protocole FIX (version 4.4) chargés dans BigQuery.

  • Combien les vendeurs ont-ils gagné à partir de chaque échange individuel ?

Outil de recherche d'ensembles de données

Le programme Google de recherche d'ensembles de données a indexé près de 25 millions d'ensembles de données sur le Web, ce qui vous permet de rechercher des ensembles de données au même endroit et de trouver des liens vers ceux-ci. Filtrez par récence, format, thème, etc.

  • Quels ensembles de données concernant <mot clé qui vous intéresse> existe-t-il ?

  • Quels ensembles de données durables l'année dernière sont-ils gratuits pour l'utilisation commerciale ?

Vous avez trouvé l'inspiration ? Relevons ensemble vos défis.

Découvrez comment les ensembles de données Google Cloud transforment la façon dont votre entreprise utilise les données et les solutions prédéfinies.
Contacter le service commercial
Si vous souhaitez intégrer un ensemble de données public, veuillez contacter public-data-help@google.com.

Le bac à sable BigQuery vous permet de tester complètement BigQuery sans compte de facturation ni carte de crédit.

Partenaires de données et témoignages de clients

Découvrez les deux côtés de l'écosystème d'ensemble de données : les fournisseurs et les utilisateurs de données.