Démarrage rapide avec Data Studio

BigQuery BI Engine est un service d'analyse en mémoire rapide. En utilisant BI Engine, vous pouvez analyser les données stockées dans BigQuery en bénéficiant d'un temps de réponse aux requêtes inférieur à une seconde et d'une simultanéité élevée.

BI Engine s'intègre à des outils Google courants tels que Google Data Studio pour accélérer l'exploration et l'analyse des données. Avec BI Engine, vous pouvez créer des tableaux de bord et des rapports interactifs riches dans Data Studio sans compromettre les performances, l'échelle, la sécurité ou la fraîcheur des données.

Objectifs

Dans ce tutoriel, vous allez :

  • Créer une réservation de capacité BI Engine à l'aide de la console d'administration BigQuery.
  • Utiliser Data Studio pour vous connecter à une table BigQuery gérée par BI Engine.
  • Créer un tableau de bord Data Studio qui interroge votre table gérée par BI Engine.

Coûts

Ce tutoriel utilise des composants facturables de Google Cloud, dont :

  • BI Engine : des frais sont facturés pour la réservation que vous créez dans BI Engine.
  • BigQuery : vous payez des frais de stockage pour la table que vous créez dans BigQuery.

Pour plus d'informations sur la tarification de BI Engine, consultez la page des tarifs.

Pour plus d'informations sur la tarification de stockage BigQuery, consultez les tarifs de stockage dans la documentation BigQuery.

Avant de commencer

Avant de commencer, assurez-vous d'avoir un projet à utiliser, d'avoir activé la facturation pour ce projet et d'avoir activé l'API BigQuery.

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier que la facturation est activée pour votre projet.

  4. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  5. Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier que la facturation est activée pour votre projet.

  6. L'API BigQuery est automatiquement activée dans les nouveaux projets. Pour activer l'API BigQuery dans un projet existant, accédez à Activez l'API BigQuery.

    Activer l'API

Étape 1  : Créer un ensemble de données BigQuery

La première étape consiste à créer un ensemble de données BI Engine pour stocker votre table gérée par BI Engine. Procédez comme suit :

  1. Accédez à la page BigQuery de Cloud Console.

    Accéder à BigQuery

  2. Dans la section Ressources du panneau de navigation, cliquez sur le nom du projet.

  3. Dans le panneau "Détails" situé à droite, cliquez sur Créer un ensemble de données.

  4. Sur la page Create dataset (Créer un ensemble de données), procédez comme suit :

    • Dans le champ Dataset ID (ID de l'ensemble de données), saisissez biengine_tutorial.
    • Dans le champ Emplacement des données, sélectionnez États-Unis (US). Les ensembles de données publics sont actuellement stockés dans l'emplacement multirégional US. Par souci de simplicité, vous devez placer votre ensemble de données dans la même zone.

      Créer une page d'ensemble de données

  5. Ne modifiez aucun autre paramètre par défaut et cliquez sur Créer un ensemble de données.

Étape 2 : Créer une table en copiant les données d'un ensemble de données public

Ce tutoriel utilise un ensemble de données disponible via le programme Google Cloud Public Dataset. Un ensemble de données public est un ensemble de données stocké dans BI Engine et mis à la disposition du grand public. Les ensembles de données publics sont des ensembles de données que BI Engine héberge afin que vous puissiez y accéder et les intégrer à vos applications. Google prend en charge le stockage de ces ensembles de données et fournit un accès public aux données via un projet.

À propos de l'ensemble de données

Dans cette section, vous allez créer une table en copiant les données de l'ensemble de données des requêtes de service San Francisco 311. Vous pouvez explorer l'ensemble de données à l'aide de Cloud Console.

Créer une table

Pour créer votre table, procédez comme suit :

  1. Dans Cloud Console, ouvrez l'ensemble de données SF 311.

    Accéder à l'ensemble de données SF 311

  2. Dans le volet de navigation, développez san_francisco_311, puis cliquez sur la table 311_service_requests.

  3. Dans la partie droite de la fenêtre, cliquez sur Copier la table.

  4. Dans la boîte de dialogue Copier la table, dans la section Destination :

    • Dans le champ Nom du projet, choisissez votre projet.
    • Pour Nom de l'ensemble de données, vérifiez que biengine_tutorial est sélectionné.
    • Pour le nom de la table, saisissez 311_service_requests_copy.

      Copier la table SF311

    • Cliquez sur Copier.

  5. Une fois la tâche de copie terminée, vous pouvez vérifier le contenu de la table en développant [PROJET] > biengine_tutorial et en cliquant sur 311_service_requests_copy > Aperçu.

Étape 3  : Créer votre réservation BI Engine

  1. Accédez à la page BI Engine de la console d'administration BigQuery.

    Accéder à la console d'administration BigQuery

  2. Cliquez sur Créer une réservation.

  3. Sur la page Créer une réservation, pour Étape 1 :

    • Vérifiez le nom de votre projet.
    • Sélectionnez votre localisation. L'emplacement doit correspondre à celui des ensembles de données que vous interrogez.
    • Ajustez le curseur en fonction de la capacité de mémoire que vous réservez. L'exemple suivant définit la capacité sur 2 Go. La valeur maximale actuelle est de 10 Go.

      Emplacement de capacité BI Engine

  4. Cliquez sur Suivant.

  5. Pour Étape 2, consultez les détails de votre réservation, puis cliquez sur Suivant.

  6. Pour Étape 3, consultez l'accord, puis cliquez sur Créer.

  7. Une fois votre réservation confirmée, les détails s'affichent sur la page Réservations.

    Réservation confirmée

Étape 4  : Créer une connexion à une source de données dans Data Studio

Avant de créer un rapport dans Google Data Studio, vous devez créer une source de données pour le rapport. Un rapport peut contenir une ou plusieurs sources de données. Google Data Studio utilise le connecteur BigQuery pour se connecter à une table BigQuery gérée par BI Engine.

Lorsque vous définissez votre connexion à une source de données dans Data Studio, BI Engine utilise la table et les colonnes que vous configurez pour déterminer les données à mettre en cache. BI Engine ne met en cache que les colonnes que vous ajoutez à votre rapport.

Autorisations requises

Vous devez disposer des autorisations appropriées pour ajouter une source de données BigQuery à un rapport Google Data Studio. En outre, les autorisations appliquées aux ensembles de données BigQuery s'appliqueront aux rapports, graphiques et tableaux de bord créés dans Google Data Studio. Lorsqu'un rapport Google Data Studio est partagé, ses composants sont visibles uniquement par les utilisateurs disposant des autorisations appropriées.

L'exécution d'une tâche de requête utilisée pour remplir un rapport nécessite des autorisations bigquery.jobs.create. Pour que la tâche de requête aboutisse, l'utilisateur ou le groupe doit avoir accès à l'ensemble de données contenant les tables référencées par la requête. Le niveau d'accès minimal requis est "Peut afficher", qui correspond au rôle bigquery.dataViewer pour cet ensemble de données.

Comme vous avez créé l'ensemble de données utilisé dans ce tutoriel, vous êtes autorisé à accéder à l'ensemble de données en tant que propriétaire, ce qui vous donne un contrôle total sur celui-ci. De plus, étant donné que vous avez créé le projet utilisé dans ce tutoriel, vous disposez d'un accès Propriétaire au niveau du projet. L'accès propriétaire vous permet d'exécuter des tâches dans le projet.

Détails des autorisations

Vous pouvez définir des autorisations bigquery.jobs.create au niveau du projet en accordant l'un des rôles IAM prédéfinis suivants  :

  • bigquery.user
  • bigquery.jobUser
  • bigquery.admin

Si vous accordez à un utilisateur ou un groupe le rôle bigquery.user au niveau du projet, par défaut, aucun accès aux ensembles de données, tables ou vues du projet n'est accordé. bigquery.user permet aux utilisateurs de créer leurs propres ensembles de données et d'exécuter des tâches de requête sur les ensembles de données auxquels ils ont accès. Si vous attribuez le rôle bigquery.user ou bigquery.jobUser, vous devez également attribuer des contrôles d'accès à chaque ensemble de données auquel l'utilisateur ou le groupe doit accéder sans l'avoir créé.

Lorsque vous attribuez l'accès à un ensemble de données, trois options sont disponibles :

  • La consultation autorisée peut correspondre au rôle bigquery.dataViewer pour cet ensemble de données.
  • La modification autorisée peut correspondre au rôle bigquery.dataEditor pour cet ensemble de données.
  • L'état de propriétaire correspond au rôle bigquery.dataOwner pour cet ensemble de données.

Pour pouvoir exécuter une requête, l'utilisateur doit au moins disposer de l'accès "Consultation autorisée".

Pour plus d'informations sur les rôles IAM dans BigQuery, voir Contrôle d'accès dans la documentation BigQuery.

Pour en savoir plus sur la sécurisation des ensembles de données dans BigQuery, consultez la section Contrôler l'accès à un ensemble de données dans la documentation BigQuery.

Créer votre source de données

Pour créer votre source de données :

  1. Ouvrez Google Data Studio.

  2. Dans la section Start a new report section (Commencer un nouveau rapport) de la page Reports (Reports), cliquez sur le modèle Blank (Vide). Un rapport sans titre est créé.

    Modèle vierge

  3. Si vous y êtes invité, renseignez les paramètres Préférences, Compte et confidentialité, puis cliquez sur Enregistrer. Vous devrez peut-être cliquer de nouveau sur le modèle Vide après l'enregistrement de vos paramètres.

  4. Dans la fenêtre Add a data source (Ajouter une source de données), cliquez sur Create new data source (Créer une source de données).

    Ajouter une source de données

  5. Dans la section Connecteurs Google, passez la souris sur BigQuery, puis cliquez sur Sélectionner.

  6. Pour Autorisation, cliquez sur Autoriser. Cela permet à Google Data Studio d'accéder à votre projet Google Cloud.

  7. Dans la boîte de dialogue Demande d'autorisation, cliquez sur Autoriser pour permettre à Google Data Studio d'afficher des données dans BigQuery. Si vous avez déjà utilisé Google Data Studio, il est possible que vous ne receviez pas cette invite.

  8. Laissez l'option Mes projets sélectionnée et, dans le volet Projet, cliquez sur le nom de votre projet.

  9. Dans le volet Ensemble de données, cliquez sur biengine_tutorial.

  10. Dans le volet Table, cliquez sur 311_service_requests_copy.

  11. Dans l'angle supérieur droit de la fenêtre, cliquez sur Connecter. Une fois que Google Data Studio se connecte à la source de données BigQuery, les champs de la table s'affichent. Vous pouvez utiliser cette page pour ajuster les propriétés des champs ou pour créer des champs calculés.

  12. En haut à droite, cliquez sur Ajouter au rapport.

  13. Lorsque vous y êtes invité, cliquez sur Add to report (Ajouter au rapport).

  14. Dans la boîte de dialogue Request for permission (Demande d'autorisation), cliquez sur Allow (Autoriser) pour permettre à Data Studio d'afficher et de gérer des fichiers dans Google Drive. Si vous avez déjà utilisé Google Data Studio, il est possible que vous ne receviez pas cette invite.

Étape 5  : Créer un graphique

Une fois que vous avez ajouté la source de données au rapport, l'étape suivante consiste à créer une visualisation. Commencez par créer un graphique à barres. Le graphique à barres que vous créez affiche les principales réclamations par quartier.

Pour créer un graphique à barres qui affiche les réclamations par quartier  :

  1. (Facultatif) En haut de la page, cliquez sur Rapport sans titre pour modifier le nom du rapport. Par exemple, saisissez BI Engine tutorial.

  2. Une fois l'éditeur de rapports chargé, cliquez sur Insérer > Graphique à barres.

  3. À l'aide des poignées, développez la taille du graphique.

  4. Dans l'onglet Données, notez que la valeur de la source de données est 311_service_requests_copy.

  5. Étant donné que vous représentez le nombre de demandes par quartier, vous devez définir la dimension sur category et la dimension "Répartition" sur neighborhood. Cliquez sur la dimension par défaut (probablement status), puis sélectionnez catégorie dans la liste.

    Choisir la dimension de catégorie

  6. Dans la liste Champs disponibles, faites glisser quartier sur la zone Ajouter une dimension ici sous Dimension de répartition.

    Ajouter la dimension de quartier

Ajouter un filtre

Étant donné que les données incluent un certain nombre de valeurs NULL dans la colonne neighborhood, vous ajoutez un filtre qui exclut les valeurs NULL du graphique.

Pour ajouter un filtre :

  1. Dans l'onglet Données, cliquez sur Ajouter un filtre.

    Ajouter une option de filtre

  2. Dans la boîte de dialogue Créer un filtre :

    • Dans le champ Nom, saisissez Exclure les valeurs NULL.
    • Vérifiez que l'option Source de données est définie sur 311_service_requests_copy.
    • Cliquez sur Inclure et sélectionnez Exclure.
    • Cliquez sur Sélectionner un champ et choisissez quartier.
    • Cliquez sur Sélectionner une condition, puis sélectionnez Est nul.

      Filtre terminé

    • Cliquez sur Save.

  3. Une fois le filtre appliqué, votre graphique doit se présenter comme suit :

    Graphique à barres terminé

Nettoyer

Supprimer le projet

Le moyen le plus simple d'empêcher la facturation est de supprimer le projet que vous avez créé pour ce tutoriel.

Pour supprimer le projet :

  1. Dans Cloud Console, accédez à la page Gérer les ressources.

    Accéder à la page Gérer les ressources

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Supprimer la réservation

Si vous avez l'intention de conserver le projet, vous pouvez également éviter des coûts supplémentaires de BI Engine en supprimant votre réservation de capacité.

Pour supprimer votre réservation  :

  1. Accédez à la page BI Engine de la console d'administration BigQuery.

    Accéder à la console d'administration BigQuery

  2. Dans la section Réservations, recherchez votre réservation.

  3. Dans la colonne Actions, cliquez sur l'icône située à droite de votre réservation, puis sélectionnez Supprimer.

  4. Dans la boîte de dialogue Confirmer la suppression de la réservation, saisissez SUPPRIMER, puis cliquez sur Continuer.

Étape suivante