Interroger un ensemble de données public avec la console Google Cloud

Découvrez comment localiser et interroger des ensembles de données publics dans BigQuery à l'aide de la console Google Cloud.


Pour obtenir des conseils détaillés sur cette tâche directement dans la console Google Cloud, cliquez sur Visite guidée :

Visite guidée


Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  4. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  5. Si vous n'activez pas la facturation pour le projet Google Cloud que vous utilisez dans ce tutoriel, vous importerez et utiliserez les données du bac à sable BigQuery. Le bac à sable BigQuery vous permet d'apprendre à utiliser BigQuery avec un ensemble limité de fonctionnalités offertes.

  6. Vérifiez que l'API BigQuery est activée.

    Activer l'API

    Si vous avez créé un nouveau projet, l'API BigQuery est automatiquement activée.

Ouvrir un ensemble de données public

Les ensembles de données publics BigQuery sont disponibles par défaut dans la console Google Cloud.

Dans l'exemple suivant, vous allez accéder aux ensembles de données du projet public bigquery-public-data.

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le volet Explorateur, cliquez sur + Ajouter.

  3. Dans la boîte de dialogue Ajouter, recherchez public datasets, puis cliquez sur Icône de l'ensemble de données public. Ensembles de données publics.

  4. Sélectionnez un ensemble de données, puis cliquez sur Afficher l'ensemble de données.

    Dans le volet Explorateur, l'ensemble de données est sélectionné et vous pouvez en afficher les détails.

  5. Facultatif : Cliquez sur  Afficher les actions à côté de votre ensemble de données pour afficher d'autres options.

    Tous les ensembles de données contiennent des tables que vous pouvez afficher en cliquant sur  Développer/réduire le nœud à côté de chaque ensemble de données.

Interroger un ensemble de données public

Dans la procédure suivante, vous allez interroger l'ensemble de données public "USA Names" pour déterminer les noms les plus couramment utilisés aux États-Unis entre 1910 et 2013 :

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Accédez au champ Éditeur .

    Si l'onglet Éditeur n'est pas visible, cliquez sur Saisir une nouvelle requête. Onglet Éditeur.

  3. Copiez la requête suivante et collez-la dans le champ Éditeur :

    SELECT
      name,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name
    ORDER BY
      total DESC
    LIMIT
      10;
    

    Si la requête est valide, une coche apparaît avec la quantité de données traitées par la requête. Si la requête n'est pas valide, un point d'exclamation apparaît avec un message d'erreur.

    Outil de validation des requêtes

  4. Cliquez sur Exécuter.

    Les noms les plus courants sont indiqués dans la section Résultats de la requête. La ligne d'en-tête de la table contient chaque nom de colonne que vous avez sélectionné dans la requête.

    Résultats de la requête dans la console Google Cloud.

  5. Facultatif : Pour afficher la durée et la quantité de données traitées par la requête, cliquez sur Informations sur la tâche dans l'onglet Résultats de la requête.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :

Supprimer le projet

Si vous avez utilisé le bac à sable BigQuery pour interroger l'ensemble de données public, la facturation n'est pas activée pour votre projet.

Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.

Pour supprimer le projet :

  1. Dans la console Google Cloud, accédez à la page Gérer les ressources.

    Accéder à la page Gérer les ressources

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Étape suivante