Analyser des données avec BI Engine et Looker

Looker est une plate-forme d'entreprise pour l'informatique décisionnelle, les applications de données et les analyses intégrées. Looker vous aide à explorer, partager et visualiser les données de votre entreprise afin de prendre de meilleures décisions.

Fonctionnement de Looker

Looker permet aux experts en données de chaque entreprise de décrire leurs données à l'aide d'un langage de modélisation léger appelé LookML. LookML indique à Looker comment interroger des données, afin que tous les membres de l'organisation puissent créer des rapports et des tableaux de bord faciles à lire pour explorer des schémas de données. Looker propose des fonctionnalités supplémentaires pour créer des applications et des expériences de données personnalisées.

La plate-forme Looker fonctionne avec des bases de données transactionnelles comme Oracle et MySQL, ainsi que des datastores analytiques tels que BigQuery, Snowflake, Redshift, etc. Looker vous permet de créer des modèles de données cohérents à partir de toutes vos données avec rapidité et précision. Looker offre une surface unifiée pour accéder à toutes les données d'une organisation.

Intégration de Looker à BigQuery

Looker est compatible avec l'hébergement dans Google Cloud. Looker étant indépendant de la plate-forme, il se connecte aux données dans BigQuery ainsi qu'à d'autres clouds publics.

Vous n'avez pas besoin de Looker pour utiliser BigQuery. Toutefois, si votre cas d'utilisation BigQuery inclut l'informatique décisionnelle, les applications de données ou les analyses intégrées, vous pouvez évaluer Looker comme fournisseur de ces services.

Si une instance Looker est déjà en cours d'exécution, consultez les instructions pour connecter Looker à BigQuery.

Premiers pas avec Looker et BigQuery

L'interface SQL de BI Engine étend les capacités de BI Engine et permet l'intégration à des outils d'informatique décisionnelle tels que Looker. Pour en savoir plus, consultez la Présentation de l'interface SQL de BigQuery BI Engine.

Créer un ensemble de données BigQuery

La première étape consiste à créer un ensemble de données BigQuery afin de stocker votre table gérée par BI Engine. Pour créer l'ensemble de données, procédez comme suit :

  1. Dans Google Cloud Console, accédez à la page "BigQuery".

    Accéder à BigQuery

  2. Dans le panneau de navigation, dans le panneau Explorer (Explorateur), cliquez sur le nom de votre projet.

  3. Dans le panneau des détails, cliquez sur Afficher les actions, puis sur Créer un ensemble de données.

  4. Sur la page Créer un ensemble de données, procédez comme suit :

    • Dans le champ ID de l'ensemble de données, saisissez biengine_tutorial.
    • Pour Emplacement des données, sélectionnez US (plusieurs régions aux États-Unis), l'emplacement multirégional où sont stockés les ensembles de données publics.

    • Pour ce tutoriel, vous pouvez sélectionner Activer l'expiration de la table, puis spécifier le nombre de jours avant expiration de la table.

      Créer une page d'ensemble de données

  5. Conservez les autres paramètres par défaut et cliquez sur Créer un ensemble de données.

Créer une table en copiant les données à partir d'un ensemble de données public

Ce tutoriel utilise un ensemble de données disponible via le programme Google Cloud Public Dataset. Les ensembles de données publics sont des ensembles de données que BigQuery héberge afin que vous puissiez y accéder et les intégrer à vos applications.

Dans cette section, vous allez créer une table en copiant les données de l'ensemble de données des requêtes de service San Francisco 311. Vous pouvez explorer l'ensemble de données à l'aide de la console Google Cloud.

Créer une table

Pour créer votre table, procédez comme suit :

  1. Dans Google Cloud Console, accédez à la page "BigQuery".

    Accéder à BigQuery

  2. Dans le panneau Explorateur, recherchez san_francisco_311.

  3. Dans le panneau Explorer, développez san_francisco_311, puis cliquez sur la table 311_service_requests.

  4. Dans la barre d'outils de l'explorateur, cliquez sur Copier.

    Sélection de l'option de copie

  5. Dans la boîte de dialogue Copier la table, dans la section Destination, procédez comme suit :

    • Pour Nom du projet, cliquez sur Parcourir, puis sélectionnez votre projet.
    • Pour Nom de l'ensemble de données, sélectionnez biengine_tutorial.
    • Pour Nom de la table, saisissez 311_service_requests_copy.

      Fenêtre de copie de table avec options de destination

  6. Cliquez sur Copier.

  7. Facultatif : une fois la tâche de copie terminée, vérifiez le contenu de la table en développant PROJECT_NAME > biengine_tutorial et en cliquant sur 311_service_requests_copy > Aperçu. Remplacez PROJECT_NAME par le nom de votre projet Google Cloud pour ce tutoriel.

Créer une réservation BI Engine

  1. Dans la console Google Cloud, sous Administration, accédez à la page BI Engine.

    Accéder à la page BI Engine

  2. Cliquez sur Créer une réservation.

  3. Sur la page Créer une réservation, configurez votre réservation BI Engine :

    • Dans la liste Projet, validez votre projet Google Cloud.
    • Dans la liste Emplacement, sélectionnez un emplacement. L'emplacement doit correspondre à l'emplacement des ensembles de données que vous interrogez.
    • Ajustez le curseur Gio de capacité en fonction de la capacité de mémoire que vous réservez. L'exemple suivant définit la capacité sur 2 Gio. La valeur maximale est de 250 Gio.

      Emplacement de capacité BI Engine

  4. Cliquez sur Suivant.

  5. Dans la section Tables préférées, vous pouvez éventuellement spécifier des tables à accélérer avec BI Engine. Pour trouver les noms de tables, procédez comme suit :

    1. Dans le champ ID de la table, saisissez une partie du nom de la table que vous souhaitez accélérer avec BI Engine, par exemple 311.
    2. Dans la liste des noms suggérés, sélectionnez les noms de vos tables.

      Seules les tables spécifiées peuvent bénéficier d'une accélération. Si aucune table préférée n'est spécifiée, toutes les requêtes de projet sont éligibles pour l'accélération.

  6. Cliquez sur Suivant.

  7. Dans la section Confirmer et envoyer, examinez l'accord.

  8. Si vous acceptez les conditions du contrat, cliquez sur Créer.

Une fois votre réservation confirmée, les détails s'affichent sur la page Réservations.

Réservation confirmée

Se connecter à l'aide de Looker

Les instructions suivantes vous expliquent comment configurer Looker à l'aide de BigQuery.

  1. Connectez-vous à Looker en tant qu'administrateur.
  2. Dans la documentation Looker sur BigQuery, complétez les sections suivantes :

    1. Créer un compte de service
    2. Configurez un OAuth pour une connexion BigQuery dans Looker.
  3. Cliquez sur l'onglet Develop (Développer), puis sélectionnez Development Mode (Mode de développement).

  4. Générez un modèle LookML et un projet pour l'ensemble de données. Pour plus d'informations, consultez les instructions de connexion de Looker à votre base de données.

  5. À l'aide du menu Explorer, accédez à une association d'exploration avec le nouveau nom de fichier de modèle Explorer 311_service_requests_copy (ou le nom que vous avez attribué à votre exploration).

Vous venez de connecter Looker à BigQuery. Vous pouvez utiliser la fonctionnalité d'activité du système de Looker pour générer un rapport d'utilisation de Looker et analyser les performances de vos requêtes par rapport aux métriques de performances spécifiques à BigQuery. Pour explorer diverses métriques de performances des requêtes BigQuery BI Engine, consultez la page Métriques BigQuery BI Engine.

Effectuer un nettoyage

Pour éviter que les ressources utilisées dans ce guide de démarrage rapide soient facturées sur votre compte Google Cloud, vous pouvez supprimer le projet, la réservation BI Engine, ou les deux.

Supprimer le projet

Le moyen le plus simple d’éliminer la facturation consiste à supprimer le projet que vous avez créé pour ce tutoriel.

Pour supprimer le projet :

  • Tout le contenu du projet est supprimé. Si vous avez utilisé un projet existant pour ce tutoriel et que vous le supprimez, vous supprimerez également tout autre travail effectué dans le projet.
  • Les ID de projets personnalisés sont perdus. Lorsque vous avez créé ce projet, vous avez peut-être créé un ID de projet personnalisé que vous souhaitez utiliser à l'avenir. Pour conserver les URL qui utilisent l'ID de projet, telle qu'une URL appspot.com, supprimez les ressources sélectionnées dans le projet au lieu de supprimer l'ensemble du projet. Si vous envisagez d'explorer plusieurs tutoriels et guides de démarrage rapide, réutiliser des projets peut vous aider à ne pas dépasser les limites de quotas des projets.
  1. Dans la console Google Cloud, accédez à la page Gérer les ressources.

    Accéder à la page BI Engine

  2. Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.

  3. Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.

Supprimer la réservation

Si vous avez l'intention de conserver le projet, vous pouvez également éviter des coûts supplémentaires de BI Engine en supprimant votre réservation de capacité.

Pour supprimer votre réservation, procédez comme suit :

  1. Dans la console Google Cloud, sous Administration, accédez à la page BI Engine.

    Accéder à la page BI Engine

  2. Dans la section Réservations, recherchez votre réservation.

  3. Dans la colonne Actions, cliquez sur l'icône  située à droite de votre réservation, puis sélectionnez Supprimer.

  4. Dans la boîte de dialogue Supprimer la réservation ?, saisissez Delete (supprimer), puis cliquez sur SUPPRIMER.

Étape suivante

Il existe de nombreuses options supplémentaires pour administrer Looker, personnaliser son modèle de données et exposer des données aux utilisateurs. Pour en savoir plus, consultez les ressources suivantes :