Visualiser des données BigQuery à l'aide de Data Studio

BigQuery est un entrepôt de données analytiques à l'échelle du pétaoctet que vous pouvez utiliser pour exécuter des requêtes SQL sur de grandes quantités de données, presque en temps réel.

Les outils de visualisation de données peuvent vous aider à comprendre les données BigQuery et à les analyser de manière interactive. Vous pouvez utiliser ces outils pour identifier des tendances, agir en conséquence et effectuer des prédictions à l'aide de vos données. Dans ce tutoriel, vous allez utiliser Google Data Studio pour visualiser les données de l'exemple de table BigQuery natality.

Objectifs

Dans ce tutoriel, vous allez :

  • Établir une connexion à une source de données BigQuery
  • Créer des rapports et des graphiques pour visualiser les données BigQuery

Coûts

Le connecteur BigQuery de Google Data Studio vous permet d'accéder aux données de vos tables BigQuery depuis Google Data Studio. BigQuery est un produit payant, dont les coûts d'utilisation vous sont facturés lorsque vous y accédez via Google Data Studio. La tarification des requêtes BigQuery vous permet de bénéficier gratuitement du premier To chaque mois. Pour en savoir plus, consultez la page des tarifs de BigQuery.

Avant de commencer

Avant de commencer ce tutoriel, utilisez la console Google Cloud Platform pour créer ou sélectionner un projet et activer la facturation.

  1. Connectez-vous à votre compte Google.

    Si vous n'en possédez pas déjà un, vous devez en créer un.

  2. Sélectionnez ou créez un projet Google Cloud Platform.

    Accéder à la page "Gérer les ressources"

  3. Assurez-vous que la facturation est activée pour votre projet Google Cloud Platform.

    Découvrir comment activer la facturation

  4. BigQuery est automatiquement activé dans les nouveaux projets. Pour activer BigQuery dans un projet préexistant : Activez BigQueryl'API requise.

    Activer l'API.

Créer des rapports et des graphiques à l'aide de Google Data Studio et du connecteur BigQuery

Dans cette section du tutoriel, vous allez utiliser Google Data Studio pour visualiser des données dans BigQuery à l'aide du connecteur BigQuery. Vous créez une source de données, un rapport et des graphiques qui visualisent les données dans l'exemple de table natality.

Créer une source de données

La première étape de la création d'un rapport dans Google Data Studio consiste à créer une source de données pour le rapport. Un rapport peut contenir une ou plusieurs sources de données. Lorsque vous créez une source de données BigQuery, Google Data Studio utilise le connecteur BigQuery.

Vous devez disposer des autorisations appropriées pour ajouter une source de données BigQuery à un rapport Google Data Studio. En outre, les autorisations appliquées aux ensembles de données BigQuery s'appliqueront aux rapports, graphiques et tableaux de bord créés dans Google Data Studio. Lorsqu'un rapport Google Data Studio est partagé, ses composants sont visibles uniquement par les utilisateurs disposant des autorisations appropriées.

Pour créer une source de données :

  1. Ouvrez Google Data Studio.

  2. Dans la section Start a new report section (Commencer un nouveau rapport) de la page Reports (Reports), cliquez sur le modèle Blank (Vide). Cette action crée un nouveau rapport sans titre.

    Modèle vierge

  3. Si vous y êtes invité, renseignez les paramètres Marketing Preferences (Préférences Marketing), Account and Privacy (Compte et Confidentialité), puis cliquez sur Save (Enregistrer). Vous devrez peut-être cliquer de nouveau sur le modèle Blank (Vide) après l'enregistrement de vos paramètres.

  4. Dans la fenêtre Add a data source (Ajouter une source de données), cliquez sur Create new data source (Créer une source de données).

    Ajouter une source de données

  5. Dans la section Google Connectors (Connecteurs Google), passez la souris sur BigQuery, puis cliquez sur Select (Sélectionner).

  6. Pour Authorization (Autorisation), cliquez sur Authorize (Autoriser). Cela permet à Google Data Studio d'accéder à votre projet GCP.

  7. Dans la boîte de dialogue Demande d'autorisation, cliquez sur Autoriser pour permettre à Google Data Studio d'afficher des données dans BigQuery. Si vous avez déjà utilisé Google Data Studio, il est possible que vous ne receviez pas cette invite.

  8. Pour My Projects (Mes projets), cliquez sur Public Datasets (Ensembles de données publics).

  9. Pour Billing Project (Projet de facturation), cliquez sur le nom du projet GCP que vous avez créé précédemment.

  10. Pour Public Dataset (Ensemble de données public), cliquez sur samples (exemples).

  11. Pour Table, cliquez sur natality.

    Table natality

  12. Dans l'angle supérieur droit de la fenêtre, cliquez sur Connect (Connecter). Une fois que Google Data Studio se connecte à la source de données BigQuery, les champs de la table s'affichent. Vous pouvez utiliser cette page pour ajuster les propriétés des champs ou pour créer des champs calculés.

  13. Dans la table natality, les champs year et source_year sont stockés sous forme d'entiers. Pour utiliser ces colonnes en tant que chaînes dans Google Data Studio, vous devez modifier le type de ces colonnes en texte. À droite des champs year et source_year, dans la colonne Type, cliquez sur Number (Nombre) et sélectionnez Text (Texte) dans la liste déroulante.

    Dialogue de champ

  14. Cliquez sur Add to report (Ajouter au rapport).

    Ajouter au rapport

  15. Lorsque vous y êtes invité, cliquez sur Add to report (Ajouter au rapport).

  16. Dans la boîte de dialogue Request for permission (Demande d'autorisation), cliquez sur Allow (Autoriser) pour permettre à Data Studio d'afficher et de gérer des fichiers dans Google Drive. Si vous avez déjà utilisé Google Data Studio, il est possible que vous ne receviez pas cette invite.

Créer un graphique à barres à partir d'un champ calculé

Une fois que vous avez ajouté la source de données natality au rapport, l'étape suivante consiste à créer une visualisation. Commencez par créer un graphique à barres. Celui-ci affiche le nombre total de naissances pour chaque année. Pour afficher les naissances par année, créez un champ calculé.

Pour créer un graphique à barres qui affiche le nombre total de naissances par année :

  1. (Facultatif) En haut de la page, cliquez sur Untitled Report (Rapport sans titre) pour modifier le nom du rapport. Par exemple, entrez BigQuery tutorial.

  2. Une fois l'éditeur de rapports chargé, cliquez sur Insert > Bar chart (Insérer > Graphique à barres).

  3. À l'aide de la poignée, placez le graphique au sein de votre rapport.

  4. Sur l'onglet Data (Données), notez la valeur de la source de données (natality) et les valeurs par défaut de dimension et de métrique.

  5. Dans la mesure où vous créez un graphique relatif au nombre de naissances par année, la dimension doit être définie sur source_year. Si elle est différente de source_year, cliquez sur source_year, puis faites glisser cette valeur depuis Champs disponibles vers la dimension par défaut afin de la remplacer.

  6. Dans la section Metric (Métrique), cliquez sur Add metric (Ajouter une métrique).

  7. Dans l'outil de sélection de métriques, cliquez sur Create field (Créer un champ).

  8. Pour afficher le nombre d'enfants nés chaque année (par sexe), créez un champ calculé. Pour ce tutoriel, vous comptez les entrées du champ is_male. La valeur dans is_male est true si l'enfant est un garçon, false s'il s'agit d'une fille. Dans la fenêtre de la nouvelle métrique, pour Nom, saisissez birth_count.

  9. Dans le champ Formule, saisissez ce qui suit : COUNT(is_male).

  10. Cliquez sur Appliquer.

  11. Cliquez sur la page du rapport pour fermer l'outil de sélection de métriques.

  12. Une fois la métrique ajoutée, passez la souris sur la métrique par défaut, puis cliquez sur l'icône de suppression située à droite. La dimension doit désormais être définie sur source_year et la métrique sur birth_count.

  13. Notez que, par défaut, le graphique est trié par ordre décroissant. Les années avec le plus de naissances s'affichent en premier.

    Graphique du total des naissances

  14. Pour améliorer le graphique, modifiez les libellés des barres. Dans la fenêtre de propriétés du graphique à barres, cliquez sur l'onglet Style.

  15. Dans la section Bar chart (Graphique à barres), cochez Show data labels (Afficher les libellés des données).

    Afficher les libellés

    Le nombre total de naissances s'affiche en haut de chaque barre du graphique.

  16. Triez les données par source_year au lieu de birth_count. Dans la fenêtre de propriétés du graphique à barres, sur l'onglet Data (Données), dans la section Sort (Trier) :

    • Cliquez sur Nouveau champ.
    • Dans le sélecteur de tri, faites défiler la page jusqu'à la section Champs du graphique, puis sélectionnez source_year.
    • Cliquez en dehors de la boîte de dialogue pour fermer le sélecteur de tri.
    • Cliquez sur Descending (Décroissant) et sélectionnez Ascending (Croissant). Le nombre de naissances par année s'affiche dans l'ordre croissant.

    Naissances par ordre croissant

Filtrer le graphique

Le graphique à barres présente actuellement le nombre total de garçons et de filles nés chaque année. Ajoutez un filtre pour afficher uniquement les filles nées chaque année.

  1. Dans la fenêtre de propriétés du graphique à barres, cliquez sur l'onglet Data (Données).

  2. Dans la section Filter (Filtre), cliquez sur Add a filter (Ajouter un filtre).

  3. Dans la fenêtre Create filter (Créer un filtre) :

    • Pour Name (Nom), saisissez Female birth count.
    • Cliquez sur Include (Inclure) et remplacez-le par Exclude (Exclure).
    • Cliquez sur Select a field (Sélectionner un champ) et sélectionnez is_male.
    • Cliquez sur Select a condition (Sélectionner une condition) et sélectionnez Vrai.
    • Cliquez sur Save (Enregistrer).

    Fenêtre Créer un filtre

Notez que le graphique a été mis à jour pour afficher uniquement les filles nées chaque année. Notez également que la légende ne change pas. Le nom de la légende reflète toujours le nom de la métrique (birth_count).

Graphique filtré

Créer un graphique à l'aide d'une requête personnalisée

En créant un graphique à l'aide de l'option "Custom Query" (Requête personnalisée), vous pouvez exploiter tout le potentiel qu'offrent les fonctionnalités de requête de BigQuery, telles que les jointures, les liaisons et les fonctions d'analyse.

Vous pouvez également tirer parti des fonctionnalités de requêtes complètes de BigQuery en créant une vue. Il s'agit d'une table virtuelle définie par une requête SQL. Vous pouvez interroger les données d'une vue en ajoutant l'ensemble de données contenant la vue en tant que source de données. Pour en savoir plus sur les vues, consultez la page Utilisation des vues.

Lorsque vous spécifiez une requête SQL comme source de données BigQuery, les résultats de requête se présentent sous forme d'une table qui devient la définition de champ (schéma) de votre source de données. Lorsque vous utilisez une requête personnalisée comme source de données, Google Data Studio l'utilise comme instruction de sélection interne pour chaque requête générée vers BigQuery. Pour en savoir plus sur les requêtes personnalisées dans Google Data Studio, consultez l'aide en ligne.

Ajouter un graphique à barres à l'aide d'une requête personnalisé

Pour ajouter à votre rapport un graphique à barres utilisant une requête personnalisée comme source de données :

  1. Dans les options du menu, sélectionnez Page > New page (Page > Nouvelle page).

  2. Cliquez sur Insert > Bar chart (Insérer > Graphique à barres).

  3. À l'aide de la poignée, placez le graphique au sein de votre rapport.

  4. Dans l'onglet Données de la fenêtre Propriétés du graphique à barres, notez que le paramètre Source de données est défini sur natality. Cliquez sur natality pour ouvrir la fenêtre Sélectionner la source de données.

  5. Cliquez sur Create new data source (Créer une source de données).

  6. Dans la section Google Connectors (Connecteurs Google), passez la souris sur BigQuery et cliquez sur Select (Sélectionner).

  7. Pour My Projects (Mes projets), cliquez sur Custom query (Requête personnalisée).

  8. Pour Project (Projet), sélectionnez votre projet GCP.

  9. Entrez la requête SQL standard suivante dans la fenêtre Enter custom query (Saisissez une requête personnalisée) :

    SELECT
     source_year,
     sum(case when is_male then 1 else 0 end) as male_births,
     sum(case when is_male then 0 else 1 end) as female_births
    FROM
     `bigquery-public-data.samples.natality`
    GROUP BY
     source_year
    ORDER BY
     source_year
    DESC
    

    Cette requête évalue le champ booléen is_male à l'aide d'une instruction CASE pour déterminer le nombre de naissances de filles et de garçons pour une année donnée.

  10. Sous Query Options (Options de requête), vérifiez que l'option Use Legacy SQL (Utiliser l'ancien SQL) est désélectionnée. Vous pouvez ainsi utiliser la syntaxe SQL standard de BigQuery.

    Requête personnalisée

  11. En haut de la fenêtre, cliquez sur Source de données sans titre et remplacez le nom de la source de données par Male female case query.

  12. Dans l'angle supérieur droit de la fenêtre, cliquez sur Connect (Connecter). Une fois que Google Data Studio est connecté à la source de données BigQuery, les résultats de requête permettent de déterminer le schéma de la table.

  13. Lorsque le schéma s'affiche, notez le type et l'agrégation de chaque champ. Par défaut, source_year est mis en forme sous la forme d'un nombre et l'agrégation est définie sur Aucun. À droite du champ source_year, dans la colonne Type, cliquez sur Number (Nombre) et sélectionnez Text (Texte). Vérifiez que l'agrégation est définie sur None (Aucun).

    Graphique filtré

  14. Cliquez sur Add to report (Ajouter au rapport).

  15. Lorsque vous y êtes invité, cliquez sur Add to report (Ajouter au rapport).

  16. Cliquez sur la flèche de retour pour fermer la fenêtre "Sélectionner une source de données".

  17. Il est possible que Google Data Studio ne puisse pas déterminer correctement la métrique appropriée pour le graphique. Étant donné que vous tracez le nombre de naissances de garçons et de filles par année, les valeurs de métrique doivent être female_births et male_births. Dans la fenêtre de propriétés du graphique à barres, sur l'onglet Données, dans la section Métrique, cliquez sur Nombre d'enregistrements.

  18. Dans l'outil de sélection de métriques, sélectionnez female_births.

  19. Dans la section Metric (Métrique), cliquez sur Add metric (Ajouter une métrique).

  20. Dans l'outil de sélection de métriques, sélectionnez male_births. Le graphique affiche désormais sur des barres distinctes le nombre de garçons et de filles nés chaque année.

    Graphique filtré

  21. Le graphique doit être trié par female_births par ordre décroissant. Remplacez cette valeur par source_year comme vous l'avez fait dans le graphique précédent. Dans la section Trier, cliquez sur female_births.

  22. Dans le sélecteur de tri, sélectionnez source_year. Le graphique affiche désormais par ordre décroissant le nombre de naissances de garçons et de filles par année.

  23. Pour plus de lisibilité, modifiez les styles du graphique. Dans la fenêtre Bar chart properties (Propriétés du graphique à barres), cliquez sur l'onglet Style.

  24. Notez que chaque barre dispose d'une couleur par défaut basée sur l'ordre dans lequel les métriques ont été ajoutées au graphique. Cliquez sur le deuxième carré de la palette de couleurs et passez du rouge au bleu.

    Graphique filtré

  25. Cliquez sur le premier carré de la palette de couleurs et passez du bleu au rouge.

    Le graphique doit se présenter comme illustré ci-dessous :

    Graphique à barres coloré

Afficher l'historique des requêtes

Pour afficher les requêtes soumises via le connecteur BigQuery, examinez l'historique de vos requêtes dans l'interface Web de BigQuery. Grâce à l'historique des requêtes, vous pouvez estimer leur coût et enregistrer celles qui pourront vous resservir dans d'autres scénarios.

Pour examiner l'historique de vos requêtes :

Console

  1. Ouvrez l'interface utilisateur Web de BigQuery dans la console GCP.
    Accéder à l'interface utilisateur Web de BigQuery

  2. Cliquez sur Historique des requêtes dans le volet de navigation de gauche.

  3. La liste des requêtes s'affiche, les plus récentes en premier. Cliquez sur une requête pour en afficher les détails, tels que l'ID de la tâche et le nombre d'octets traités.

UI classique

  1. Accédez à l'interface utilisateur Web de BigQuery.

    Accéder à l'interface utilisateur Web de BigQuery

  2. Cliquez sur Query History (Historique des requêtes).

  3. La liste des requêtes s'affiche, les plus récentes en premier. Cliquez sur Open Query (Ouvrir la requête) pour afficher les détails de la requête, tels que l'ID de la tâche et le nombre d'octets traités.

    Graphique à barres coloré

Nettoyer

Pour éviter que les ressources utilisées lors de ce tutoriel soient facturées sur votre compte Google Cloud Platform :

  1. Dans la console GCP, accédez à la page "Projets".

    Accéder à la page Projets

  2. Dans la liste des projets, sélectionnez celui que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

La suppression de votre projet empêche Google Data Studio d'interroger les données car la source de données est associée à votre projet. Si vous ne souhaitez pas supprimer votre projet Cloud Platform, vous pouvez supprimer la source de données et le rapport Google Data Studio.

Pour supprimer les ressources Google Data Studio, procédez comme suit :

  1. Ouvrez Google Data Studio.

  2. Sur la page Rapports, à droite du rapport du tutoriel BigQuery, cliquez sur le bouton "Plus" Bouton "plus" et sélectionnez Supprimer.

  3. Cliquez sur Sources de données.

  4. À droite de la source de données natality, cliquez sur le bouton "more" (plus) et sélectionnez Remove (Supprimer).

  5. À droite de la source de données Male female case query, cliquez sur le bouton "more" (plus) et sélectionnez Remove (Supprimer).

Étapes suivantes

Cette page vous a-t-elle été utile ? Évaluez-la :

Envoyer des commentaires concernant…