Interroger un ensemble de données public avec l'outil bq
Découvrez comment examiner et interroger un ensemble de données public avec l'outil de ligne de commande bq.
Pour obtenir des instructions détaillées sur cette tâche directement dans la console Google Cloud, cliquez sur Visite guidée :
Avant de commencer
- Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
Vérifiez que l'API BigQuery est activée.
Si vous avez créé un nouveau projet, l'API BigQuery est automatiquement activée.
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
Si vous n'activez pas la facturation pour le projet Google Cloud que vous utilisez dans ce tutoriel, vous utiliserez les données du bac à sable BigQuery. Le bac à sable BigQuery vous permet d'apprendre à utiliser BigQuery avec un ensemble limité de fonctionnalités offertes.
Examiner un ensemble de données public
BigQuery propose plusieurs exemples de tables dans l'ensemble de données bigquery-public-data.samples
que vous pouvez interroger. Dans ce tutoriel, vous exécutez des requêtes sur la table shakespeare
, qui contient une entrée pour chaque mot de chaque pièce de Shakespeare.
Examinez la table shakespeare
de l'ensemble de données samples
:
bq show bigquery-public-data:samples.shakespeare
Le résultat renvoyé ressemble à ceci : Certaines colonnes sont omises pour simplifier la sortie.
Last modified Schema Total Rows Total Bytes
----------------- ------------------------------------ ------------ ------------
14 Mar 17:16:45 |- word: string (required) 164656 6432064
|- word_count: integer (required)
|- corpus: string (required)
|- corpus_date: integer (required)
Interroger un ensemble de données public
Utilisez la commande bq query
pour exécuter des requêtes SQL sur les données.
Déterminez le nombre de fois que la sous-chaîne
raisin
apparaît dans les œuvres de Shakespeare :bq query --use_legacy_sql=false \ 'SELECT word, SUM(word_count) AS count FROM `bigquery-public-data.samples.shakespeare` WHERE word LIKE "%raisin%" GROUP BY word;'
Le résultat ressemble à ce qui suit :
+---------------+-------+ | word | count | +---------------+-------+ | praising | 8 | | Praising | 4 | | raising | 5 | | dispraising | 2 | | dispraisingly | 1 | | raisins | 1 | +---------------+-------+
Recherchez la sous-chaîne
huzzah
dans les œuvres de Shakespeare :bq query --use_legacy_sql=false \ 'SELECT word FROM `bigquery-public-data.samples.shakespeare` WHERE word = "huzzah";'
Comme la sous-chaîne n'apparaît pas dans les œuvres de Shakespeare, aucun résultat n'est renvoyé.
Effectuer un nettoyage
Pour éviter que les ressources utilisées sur cette page ne soient facturées sur votre compte Google Cloud, supprimez le projet Google Cloud contenant les ressources.
Supprimer le projet
Si vous avez utilisé le bac à sable BigQuery pour interroger l'ensemble de données public, la facturation n'est pas activée pour votre projet.Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.
Pour supprimer le projet :
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Étapes suivantes
- En savoir plus sur l'utilisation de l'outil bq.
- Découvrez le bac à sable BigQuery.
- Découvrez les ensembles de données publics BigQuery.
- Découvrez comment charger des données dans BigQuery.
- Apprenez à interroger des données dans BigQuery.
- Consulter les notes de version de BigQuery
- En savoir plus sur les tarifs de BigQuery
- Découvrez les quotas et limites de BigQuery.