Charger et interroger des données avec Google Cloud Console

Découvrez comment utiliser Google Cloud Console pour créer un ensemble de données, charger des exemples de données dans une table BigQuery et interroger des tables.


Pour obtenir des conseils détaillés sur cette tâche directement dans Cloud Console, cliquez sur Visite guidée :

VISITE GUIDÉE


La procédure décrite dans les sections suivantes, est la même que si vous cliquez sur Visite guidée.

Avant de commencer

Avant de pouvoir explorer BigQuery, vous devez vous connecter à Cloud Console et créer un projet. Si vous n'activez pas la facturation dans votre projet, toutes les données que vous importez se trouvent dans le bac à sable BigQuery. Vous pouvez ainsi apprendre à utiliser BigQuery sans frais, tout en utilisant un ensemble limité de fonctionnalités BigQuery. Pour en savoir plus sur le bac à sable BigQuery, y compris sur ses limites, sur l'ajout d'un compte de facturation et la mise à niveau de votre projet, ou encore sur le dépannage, consultez la page Activer le bac à sable BigQuery.

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  4. Facultatif : Si vous sélectionnez un projet existant, veillez à activer l'API BigQuery. L'API BigQuery est automatiquement activée dans les nouveaux projets.

Créer un ensemble de données BigQuery

Utilisez Cloud Console pour créer un ensemble de données qui stocke les données.

  1. Dans Cloud Console, ouvrez la page "BigQuery".
  2. Accéder à BigQuery
  3. Dans le panneau Explorateur, cliquez sur le nom de votre projet.
  4. Développez la section Afficher les actions > Créer un ensemble de données.
  5. Sur la page Créer un ensemble de données, procédez comme suit :
    1. Dans le champ ID de l'ensemble de données, saisissez babynames.
    2. Dans la liste Emplacement des données, choisissez us (plusieurs régions aux États-Unis). Les ensembles de données publics sont stockés dans l'emplacement multirégional us. Par souci de simplicité, stockez votre ensemble de données dans le même emplacement.
    3. Conservez les autres paramètres par défaut, puis cliquez sur Créer un ensemble de données.

Télécharger le fichier de données source

Le fichier que vous téléchargez contient environ 7 Mo de données correspondant aux prénoms populaires donnés aux bébés. Il provient de l'Administration de la sécurité sociale des États-Unis.

Pour en savoir plus sur cet ensemble de données, consultez la page d'informations sur l'ensemble de données de l'Administration de la sécurité sociale.

  1. Téléchargez l'ensemble de données de l'Administration de la sécurité sociale des États-Unis en ouvrant l'URL suivante dans un nouvel onglet du navigateur :

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. Extrayez le fichier.

    Pour en savoir plus sur le schéma de l'ensemble de données, consultez le fichier NationalReadMe.pdf du fichier ZIP.

  3. Pour voir à quoi ressemblent les données, ouvrez le fichier yob2014.txt. Ce fichier contient des valeurs séparées par une virgule spécifiant le nom, le sexe (M ou F) et le nombre d'enfants portant ce prénom. Le fichier ne comporte pas de ligne d'en-tête.

  4. Notez l'emplacement du fichier yob2014.txt pour pouvoir le retrouver ultérieurement.

Charger des données dans une table

Charger les données dans une table.

  1. Dans le panneau Explorateur, cliquez sur le nom de votre projet.
  2. À côté de l'ensemble de données babynames, cliquez sur Autres actions , puis sélectionnez Ouvrir.
  3. Dans le panneau de détails, cliquez sur Créer une table.

    Sauf indication contraire, utilisez les valeurs par défaut pour tous les paramètres.

  4. Sur la page Créer une table, procédez comme suit :
    1. Dans la section Source, choisissez Importer dans la liste Créer une table à partir de.
    2. Dans le champ Sélectionner un fichier, cliquez surParcourir.
    3. Accédez à votre fichier yob2014.txt local et ouvrez-le, puis cliquez sur Ouvrir.
    4. Dans la liste Format de fichier, sélectionnez CSV.
    5. Dans la section Destination, saisissez names_2014 en tant queNom de la table.
    6. Dans la section Schéma, cliquez sur le bouton Modifier sous forme de texte et collez la définition de schéma suivante dans le champ de texte :
    7. name:string,gender:string,count:integer
    8. Cliquez sur Créer une table.
      Attendez que BigQuery crée la table et charge les données. Une fois que BigQuery a fini de charger les données, développez le panneau Historique personnel et Historique du projet pour examiner les détails de la tâche.

Prévisualiser les données de la table

Pour prévisualiser les données de la table, procédez comme suit :

  1. Dans le panneau Explorateur, développez votre projet et votre ensemble de données babynames, puis sélectionnez la table names_2014.
  2. Dans le panneau de détails, cliquez sur Aperçu. BigQuery affiche les premières lignes de la table.
  3. BigQuery affiche les premières lignes de la table. Aperçu de la table dans Cloud Console.
L'onglet Aperçu n'est pas disponible pour tous les types de table. Par exemple, l'onglet Aperçu n'est pas affiché pour les tables ou les vues externes.

Les interroger

Vous allez maintenant interroger la table. Le processus est identique à l'exemple précédent, sauf que cette fois, vous interrogez votre table au lieu d'une table publique.

  1. Cliquez sur Saisir une nouvelle requête. Un onglet Éditeur s'affiche.
  2. Dans le champ Éditeur, collez la requête suivante : Cette requête permet de récupérer les cinq premiers prénoms masculins donnés aux enfants nés aux États-Unis en 2014.
    
        SELECT
          name,
          count
        FROM
          `babynames.names_2014`
        WHERE
          gender = 'M'
        ORDER BY
          count DESC
        LIMIT
          5
        
  3. Cliquez sur Exécuter. Les résultats sont affichés dans la section Résultats de la requête.
    Résultats de la requête sur les prénoms.

Vous êtes parvenu à interroger une table dans un ensemble de données public, puis à charger vos exemples de données dans BigQuery à l'aide de Cloud Console.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud :

  1. Dans Cloud Console, ouvrez la page "BigQuery".
  2. Accéder à BigQuery
  3. Dans le panneau Explorateur, cliquez sur l'ensemble de données babynames que vous avez créé.
  4. Développez l'option Afficher les actions, puis cliquez sur Supprimer.
  5. Dans la boîte de dialogue Supprimer l'ensemble de données, confirmez la commande de suppression en saisissant le mot delete avant de cliquer sur Supprimer.

Étapes suivantes