Découvrez nos dernières innovations concernant les bases de données, l'analyse et l'IA lors du Cloud Data Summit Événement disponible en direct et à la demande à partir du 26 mai

Ensembles de données

Améliorez vos initiatives d'analyse et d'IA avec des solutions de données prédéfinies et des ensembles de données intéressants basés sur BigQuery, Cloud Storage, Earth Engine et d'autres services Google Cloud.

Développez votre écosystème de données

Augmentez la valeur de vos éléments de données en augmentant vos initiatives d'analyse ou d'IA avec des données externes. Découvrez et consultez des ensembles de données uniques et intéressants, ainsi que des solutions prédéfinies par Google, des fournisseurs publics ou des fournisseurs. Avec des pipelines de données entièrement gérés, vous pouvez vous concentrer sur l'essentiel : fournir des insights et une valeur commerciale.

Catégorie Sélection d'ensembles de données Exemples de requêtes, de cas d'utilisation et de solutions
Ensembles de données Google

Consultez les 25 requêtes les plus populaires et les 25 en hausse de Google Trends au cours des 30 derniers jours avec cet ensemble de données. Chaque terme inclut cinq ans de données d'historique dans les 210 zones de marché désignées aux États-Unis.

  • check_circle_filled_black_24dp (1)

    Quelle est la priorité des auditeurs dans ma zone d'actualité/de diffusion ?

  • check_circle_filled_black_24dp (1)

    Quels sont les termes de recherche les plus courants aux États-Unis pour les dernières données disponibles ?

  • check_circle_filled_black_24dp (1)

    Quels sont les articles de détail les plus populaires que les internautes ont recherchés dans la région ?

Rapports sur la mobilité de la communauté

Cet ensemble de données a pour but de vous fournir des renseignements sur les changements induits par les politiques de lutte contre la COVID-19. Il présente des tendances de déplacement au fil du temps par zone géographique, mais aussi par catégorie de lieux, par exemple les commerces et espaces de loisirs, les magasins d'alimentation et pharmacies, les parcs, les stations de transports en commun, les lieux de travail et les zones résidentielles.

  • check_circle_filled_black_24dp (1)

    Quel a été l'impact du confinement appliqué à San Francisco sur les visites en magasin ?

  • check_circle_filled_black_24dp (1)

    Cas d'utilisation : Identifier la différence de trafic de vente les week-ends

Google Analytics (exemple)

L'ensemble de données fournit 12 mois (août 2016 à août 2017) de données Google Analytics 360 masquées provenant du Google Merchandise Store, une véritable boutique d'e-commerce qui vend des produits de marque Google. Ces données sont typiques de ce que voit un site Web d'e-commerce et comprennent les données de source de trafic, les données de contenu et les données transactionnelles.

Recherche sur Google Brevets

Ces données contiennent la sortie de la majeure partie du travail d'analyse des données utilisé dans Google Brevets (patents.google.com), y compris la traduction automatique des titres et des extraits de Google Traduction, ou vecteurs de représentation vectorielle continue, termes populaires extraits, documents similaires et références de transfert.

  • check_circle_filled_black_24dp (1)

    Quels sont les 20 brevets les plus récemment déposés ?

  • check_circle_filled_black_24dp (1)

    Quelles entreprises du classement Fortune 500 ont déposé activement des brevets entre 2017 et 2019 ?  

Ensembles de données publics
Détails de l'événement de tempête majeure

La base de données sur les tempêtes est une base de données intégrée qui regroupe les événements météorologiques violents aux États-Unis de 1950 à cette année. Elle contient des informations sur l'emplacement, l'azimut, la distance, l'impact et la gravité d'une tempête, y compris le coût des dommages matériels et agricoles.

  • check_circle_filled_black_24dp (1)

    Quelles tempêtes des 15 dernières années ont provoqué le plus de dégâts matériels ?

  • check_circle_filled_black_24dp (1)
  • check_circle_filled_black_24dp (1)

    Cas d'utilisation : compréhension des détaillants en bricolage de l'impact des tempêtes sur les stocks

Limites du Bureau de recensement des États-Unis

Il s'agit de fichiers de limites en résolution maximale, dérivés de TIGER/Line Shapefiles, les principaux produits géographiques pris en charge par le Bureau du recensement des États-Unis. Ils incluent des informations sur les 50 = États, le District de Columbia, Porto Rico et les régions insulaires périphériques.

  • check_circle_filled_black_24dp (1)

    Quelles sont les villes les plus aéroportées des États-Unis dans un rayon de 16 kilomètres autour de son agglomération ?

  • check_circle_filled_black_24dp (1)

    Cas d'utilisation : développer un index d'urbanisation pour les marchands

American Community Survey

L'American Community Survey (ACS) est une enquête continue qui fournit des informations essentielles chaque année sur les États-Unis et ses habitants en contactant plus de 3,5 millions de foyers de tout le pays. Les données obtenues fournissent des données démographiques extrêmement détaillées sur les États-Unis, à différents niveaux géographiques.

  • check_circle_filled_black_24dp (1)

    Comment les loyers, en tant que part du revenu médian ont-ils évolué d'une année sur l'autre ?  

  • check_circle_filled_black_24dp (1)

    Cas d'utilisation : tendances de la croissance de la population comme entrées pour l'analyse de la sélection d'installations/de sites

Tous les ensembles de données publics

Recherchez et accédez à plus de 200 ensembles de données répertoriés dans Google Cloud Marketplace.

  • check_circle_filled_black_24dp (1)

    Quels ensembles de données peuvent fournir un contexte plus approfondi pour nos workflows d'analyse ou d'IA ?

Ensembles de données commerciaux
Crux Informatics

Crux Delivery est un service géré conçu pour l'ingénierie et les opérations des données. Crux délivre tous les fournisseurs de données traditionnels et alternatifs pour le compte de ses clients, et gère tous les aspects de l'intégration, de l'ingénierie des données et des opérations. Chaque ensemble de données est validé, afin de ne pouvoir fournir que des données propres et exploitables.

  • check_circle_filled_black_24dp (1)

    Quels ensembles de données Crux peut-il m'aider à intégrer à mon écosystème de données ?

HouseCanary

Accès instantané à des informations fiables sur les biens, les prêts et la valeur pour 100 millions de maisons. Les algorithmes de ML traitent des centaines de sources de données afin de fournir des indices de prix d'habitation pour 381 agglomérations, 18 300 codes postaux et 4 millions de blocs couvrant plus de 95 % du marché résidentiel américain. Prenez des décisions d'investissement basées sur des informations historiques sur les fluctuations sur 40 ans et sur des prévisions sur trois ans.

  • check_circle_filled_black_24dp (1)

    Quels sont les codes postaux susceptibles de voir une augmentation de 3 % ou plus sur l'immobilier l'année prochaine ?

  • check_circle_filled_black_24dp (1)

    Quelle est la valeur d'une propriété spécifique ?

Ensembles de données Earth Engine
Earth Engine

Les archives de données publiques d'Earth Engine incluent plus de 40 ans d'images historiques et d'ensembles de données scientifiques, mises à jour quotidiennement et disponibles pour une analyse en ligne.

  • check_circle_filled_black_24dp (1)

    Comment la température de surface a-t-elle évolué au cours des 30 dernières années ?

  • check_circle_filled_black_24dp (1)

    À quoi ressemblait cette zone avant 2000 ?

Ensembles de données Kaggle
Ensembles de données Kaggle

Dans Kaggle, vous trouverez tous les codes et données dont vous avez besoin pour vos travaux de science des données. Utilisez plus de 80 000 ensembles de données publics et 400 000 notebooks publics pour mener une analyse en un rien de temps.

  • check_circle_filled_black_24dp (1)

    Saurez-vous aborder les problèmes les plus contradictoires et provocateurs en science des données ?

Ensembles de données synthétiques
Cymbal Investments

Les données synthétiques représentent les transactions des bots automatisés exploités par le groupe fictif Cymbal Investments, chacun utilisant un seul algorithme pour guider ses décisions commerciales. Les enregistrements sont issus des rapports Trade Capture du protocole FIX (version 4.4) chargés dans BigQuery.

  • check_circle_filled_black_24dp (1)

    Combien les vendeurs ont-ils gagné à partir de chaque échange individuel ?

Rechercher des ensembles de données

Le programme Google de recherche d'ensembles de données a indexé près de 25 millions d'ensembles de données sur le Web, ce qui vous permet de rechercher des ensembles de données au même endroit et de trouver des liens vers ceux-ci. Filtrez par récence, format, thème, etc.

  • check_circle_filled_black_24dp (1)

    Quels ensembles de données concernant <mot clé qui vous intéresse> existe-t-il ?

  • check_circle_filled_black_24dp (1)

    Quels ensembles de données durables l'année dernière sont-ils gratuits pour l'utilisation commerciale ?

Catégorie

Vous avez trouvé l'inspiration ? Relevons ensemble vos défis.

Découvrez comment les ensembles de données Google Cloud transforment la façon dont votre entreprise utilise ses données et des solutions prédéfinies.
Contacter le service commercial
Si vous souhaitez intégrer un ensemble de données public, veuillez contacter public-data-help@google.com.

Le bac à sable BigQuery vous permet de tester complètement BigQuery sans compte de facturation ni carte de crédit.

Partenaires de données et témoignages de clients

Découvrez les deux côtés de l'écosystème d'ensemble de données : les fournisseurs de données et les utilisateurs de données.