Interroger un ensemble de données public avec la console Cloud

Découvrez comment localiser et interroger des ensembles de données publics dans BigQuery à l'aide de la console Google Cloud.


Pour obtenir des conseils détaillés sur cette tâche directement dans Cloud Console, cliquez sur Visite guidée:

Visite guidée


La procédure décrite dans les sections suivantes, est la même que si vous cliquez sur Visite guidée.

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  4. Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier si la facturation est activée sur un projet.

  5. Si vous n'activez pas la facturation pour le projet Cloud que vous utilisez dans ce tutoriel, vous importerez et utiliserez les données du bac à sable BigQuery. Le bac à sable BigQuery vous permet d'apprendre à utiliser BigQuery avec un ensemble limité de fonctionnalités offertes.

  6. Vérifiez que l'API BigQuery est activée.

    Activer l'API

    Si vous avez créé un nouveau projet, l'API BigQuery est automatiquement activée.

Ouvrir un ensemble de données public

Les ensembles de données publics BigQuery sont disponibles par défaut dans Cloud Console.

Pour ouvrir les ensembles de données publics, procédez comme suit :

  1. Dans la console Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Dans le champ Type à rechercher, saisissez bigquery-public-data.

    Si le projet ne s'affiche pas, saisissez bigquery dans le champ de recherche, puis cliquez sur Élargir la recherche à tous les projets pour faire correspondre la chaîne de recherche avec les ensembles de données existants.

  3. Pour épingler l'ensemble de données bigquery-public-data à votre projet, cliquez sur Cliquer pour épingler.

  4. Pour continuer, effacez le champ de recherche.

  5. Pour afficher les ensembles de données sous-jacents, développez l'ensemble de données bigquery-public-data.

  6. Pour ouvrir un ensemble de données sous-jacent et afficher ses informations, cliquez sur Autres actions > Ouvrir.

Effectuer des requêtes sur un ensemble de données public

Dans la procédure suivante, vous allez interroger l'ensemble de données public "USA Name" pour déterminer les noms les plus couramment utilisés aux États-Unis entre 1910 et 2013 :

  1. Dans la console Cloud, accédez à la page BigQuery.

    Accéder à BigQuery

  2. Accédez au champ Éditeur .

    Si l'onglet Editor (Éditeur) n'est pas visible, cliquez sur Compose new query (Saisir une nouvelle requête).

    Onglet Éditeur.

  3. Dans le champ Éditeur, copiez la requête suivante :

    SELECT
      name, gender,
      SUM(number) AS total
    FROM
      `bigquery-public-data.usa_names.usa_1910_2013`
    GROUP BY
      name, gender
    ORDER BY
      total DESC
    LIMIT
      10
    

    Si la requête est valide, une coche apparaît avec la quantité de données traitées par la requête. Si la requête n'est pas valide, un point d'exclamation apparaît avec un message d'erreur.

    Outil de validation des requêtes

  4. Cliquez sur Exécuter.

    Les noms les plus courants sont indiqués dans la section Résultats de la requête. La ligne d'en-tête de la table contient chaque nom de colonne que vous avez sélectionné dans la requête.

    Résultats de la requête dans Cloud Console.

  5. Facultatif : Pour afficher la durée et la quantité de données traitées par la requête, cliquez sur Informations sur la tâche dans l'onglet Résultats de la requête.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud :

Supprimer le projet

Si vous avez utilisé le bac à sable BigQuery pour interroger l'ensemble de données public, la facturation n'est pas activée pour votre projet.

Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.

Pour supprimer le projet :

  1. Dans Cloud Console, accédez à la page Gérer les ressources :

    Accéder à la page Gérer les ressources

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Étape suivante