Blocs Looker

Les Looker BlocksTM sont des modèles de données prédéfinis pour les sources de données et les modèles analytiques courants. Réutilisez les travaux que d'autres ont effectués au lieu de recommencer à zéro, puis personnalisez les blocs pour les adapter à vos spécifications exactes. Des modèles SQL optimisés aux modèles de données entièrement construits, les blocs Looker peuvent être utilisés comme point de départ pour une modélisation rapide et flexible des données dans Looker.

Blocs disponibles

Vous avez le choix entre de nombreux blocs Looker. Pour connaître les blocs disponibles, consultez la section Blocages de Looker Marketplace.

Cliquez sur un bloc qui vous intéresse pour consulter ses instructions d'utilisation spécifiques.

Certains blocs Looker peuvent être installés rapidement à l'aide de Looker Marketplace. Pour que vous puissiez déployer un bloc via Looker Marketplace, un administrateur Looker doit avoir activé la fonctionnalité Marketplace. L'installation de blocs contenant un paramètre local_dependency nécessite également l'activation de la fonctionnalité Local Project Import Labs. Pour en savoir plus sur l'installation et la personnalisation des blocs Looker, consultez la page de documentation de Looker Marketplace.

Normalisation et personnalisation

La facilité d'utilisation des différents blocs varie en fonction du degré de standardisation du schéma de votre base de données. La plupart des blocs Looker nécessitent une certaine personnalisation pour s'adapter à votre schéma de données, à l'exception des blocs de données, qui sont les plus simples à implémenter, mais qui ne sont pas personnalisables.

  • Les blocs de données, qui comprennent à la fois des jeux de données publics et des modèles LookML complets, nécessitent simplement de copier le modèle LookML à partir du dépôt GitHub pour accéder aux tables modélisées. Consultez la section Utiliser des blocs de données sur cette page pour obtenir des instructions détaillées.

  • Les applications de collecte de données, telles que Segment et Snowplow, assurent le suivi des événements dans un format relativement standardisé. Cela permet de créer des modèles de conception, capables de nettoyer, de transformer et d'analyser les données, qui peuvent être utilisés par n'importe quel client utilisant ces applications.

  • D'autres applications Web, telles que Salesforce, vous permettent d'ajouter des champs personnalisés pour vos utilisateurs internes. Naturellement, cela crée des données dans un format moins standardisé. Par conséquent, nous pouvons modéliser une partie du modèle de données pour rendre les analyses opérationnelles, mais vous devrez personnaliser la partie non standardisée.

  • Enfin, nous avons des blocs pour les insights métier généraux. Il s'agit de modèles de conception SQL ou LookML optimisés qui sont indépendants de la source de données. Par exemple, de nombreuses entreprises souhaitent analyser la valeur vie d'un client au fil du temps. Ces modèles comportent certaines hypothèses, mais vous pouvez les personnaliser en fonction des besoins spécifiques de votre entreprise. Ces modèles reflètent le point de vue de Looker sur la meilleure façon d'effectuer certains types d'analyses.

Si vous débutez avec Looker, votre analyste Looker peut vous aider à tirer le meilleur parti de ces modèles.

Ajout de blocs à votre code LookML

  • Certains blocs illustrent à la fois les explorations et les vues dans le même fichier. Ceci est pour faciliter la visualisation, mais en général, il est préférable de copier les sections appropriées de LookML dans les endroits appropriés de votre modèle de données. Pour en savoir plus, consultez la page de documentation Comprendre les fichiers de modèle et de vue.
  • Dans certains cas, vous souhaiterez probablement créer de nouveaux fichiers LookML dans votre modèle de données pour héberger les exemples.

Utiliser des blocs de données

Les blocs de données sont un type spécial de bloc Looker qui fournissent l'ensemble de données ainsi que le modèle de données. Les blocs de données Looker incluent des sources de données publiques, telles que:

  • Données démographiques: il s'agit des métriques démographiques courantes de l'American Community Survey au niveau de l'État, du comté, de la zone de tableau tabulaire par code postal et même du groupe de recensement.
  • Données météorologiques: bulletins météo au niveau du code postal aux États-Unis de 1920 à la veille. Ce bloc est mis à jour chaque nuit.

Pour afficher la liste complète des blocages disponibles, consultez la section Blocages de Looker Marketplace.

Accéder aux jeux de données sur différentes bases de données

La procédure d'accès à l'ensemble de données d'un bloc de données varie en fonction du schéma de votre base de données. Les sections suivantes contiennent des instructions pour accéder aux ensembles de données de ces bases de données:

Accéder aux ensembles de données sur Google BigQuery

Si vous possédez déjà un compte Google BigQuery, vous pouvez accéder aux ensembles de données Looker hébergés sur BigQuery. Passez directement à la section Ajouter des blocs de données aux projets de cette page.

Si vous ne possédez pas encore de compte Google BigQuery, vous pouvez configurer un essai gratuit, puis accéder aux ensembles de données publics de Looker sur BigQuery.

Accéder aux jeux de données sur d'autres bases de données

Utilisez-vous Amazon Redshift, MySQL, PostgreSQL ou Oracle ?

Les données transformées de chacun de ces ensembles de données sont désormais accessibles au public dans Google Cloud Service et S3 pour que vous puissiez les importer directement dans la base de données de votre choix.

Nous avons également mis à disposition le langage de définition de données (LDD) pour chacun des ensembles de données du dépôt GitHub. Les instructions LDD peuvent avoir besoin d'être modifiées pour les types de données de la base de données sélectionnée, mais elles devraient vous donner une idée des types de colonnes pour chaque table.

Téléchargez les données directement depuis l'un des emplacements suivants:

Accès au modèle LookML

Dupliquez l'un de nos dépôts GitHub dans un nouveau dépôt GitHub (hébergé par Looker ou par votre entreprise) que vous pouvez ensuite étendre ou améliorer dans votre instance:

Ajouter des blocs de données aux projets

En plus de la méthode décrite dans cette section, vous pouvez utiliser des raffinements LookML pour exploiter le LookML des vues et des explorations dans vos projets.

Pour ajouter un bloc de données à votre projet:

  1. Ajoutez un projet à votre instance Looker.

  2. Dupliquez ou copiez les dépôts GitHub mentionnés précédemment pour accéder au code LookML prédéfini. Veillez à créer un dépôt GitHub.

  3. Supprimez les autres fichiers de dialectes de base de données du dépôt. Les blocs Looker contiennent généralement des fichiers pour Google BigQuery, Amazon Redshift et Snowflake. Par exemple, si vous configurez des blocs de données sur Google BigQuery, vous n'aurez besoin que des fichiers de vue Google BigQuery, du fichier d'exploration Google BigQuery et du fichier de modèle Google BigQuery.

  4. Remplacez le nom de connexion dans votre fichier de modèle par votre connexion à la base de données qui contient les données des blocs de données. Si vous utilisez Google BigQuery ou Snowflake, utilisez la connexion à la base de données à partir de laquelle vous allez étendre ou affiner.

    Toute la logique de jointure existe dans un fichier .explore dans chacun des dépôts. Il s'agit du fichier que vous allez inclure dans les étapes suivantes, une fois que vous aurez configuré le fichier manifeste de votre projet.

  5. Dans votre projet Looker principal où vous allez étendre ou affiner des blocs de données, créez un fichier manifeste de projet.

  6. Ajoutez le code LookML suivant au fichier manifeste du projet pour faire référence aux blocs de données de votre projet Looker principal:

    project_name: "<your_project_name\>"

    local_dependency: {
      project: "<project_name_of_datablock\>"
    }

Remarques et options de configuration

Google BigQuery: assurez-vous d'utiliser le bon ensemble de fichiers modélisés. Si vous utilisez Google BigQuery, vous pouvez référencer tous les fichiers dont le nom de fichier contient _bq_. Vous devrez peut-être adapter les dialectes de nos modèles Google BigQuery à votre propre dialecte de base de données.

Extensions: tous nos projets ont été configurés de façon à autoriser les extensions issues des fichiers d'exploration, car les extensions des modèles peuvent entraîner des problèmes avec plusieurs connexions.

Joindre des tables dérivées: nous vous invitons à consulter notre documentation sur les tables dérivées natives. Vous pouvez laisser Looker écrire du code SQL pour vous à différents niveaux d'agrégation sur nos ensembles de données publics et les joindre à votre modèle.

Fusionner des ensembles de résultats: vous pouvez également choisir de fusionner des ensembles de résultats issus de nos ensembles de données avec vos données en combinant des ensembles de résultats de requête.

Exemple de configuration de l'ensemble de données démographiques

  1. Accédez aux données en téléchargeant des données brutes à partir de nos buckets de services S3 ou Google Cloud, ou en vous connectant à une base de données Looker.

  2. Importez le modèle de bloc de données démographiques depuis LookML en tant que projet distinct dans votre instance Looker.

  3. Utilisez le paramètre include pour importer le fichier de vue.

  4. Ensuite, vous devez soit étendre ou affiner le fichier de vue, soit utiliser des tables dérivées natives pour obtenir le niveau d'agrégation nécessaire pour les explorations.

    Dans notre exemple, les données démographiques se trouvant à un niveau d'agrégation différent de celui de notre ensemble de données d'e-commerce (groupe de blocs ou code postal), nous utilisons des tables dérivées natives pour regrouper les statistiques jusqu'au niveau du code postal. Cela élimine les jointures "plusieurs à plusieurs" désordonnées:

      include: "/american_community_survey/bq.explore"
    
      view: zipcode_income_facts {
        derived_table: {
          persist_for: "10000 hours"
          explore_source: fast_facts {
            column: ZCTA5 { field: tract_zcta_map.ZCTA5 }
            column: income_household { field: bg_facts.avg_income_house }
            column: total_population { field: bg_facts.total_population }
          }
        }
        dimension: ZCTA5 {}
        dimension: income_household {
          hidden: yes
        }
    
  5. Joindre des fichiers de vue au modèle:

      include: "acs*.view"
    
      explore: order_items {
        join: users {
          sql_on: ${users.id} = ${order_items.user_id} ;;
          type: left_outer
          relationship: many_to_one
        }
    
        join: zipcode_income_facts {
          sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;;
          type: left_outer
          relationship: many_to_one
        }
      }
    
  6. Explorer et visualiser les données

Utiliser des blocs de visualisation

Looker inclut différents types de visualisation intégrés. Toutefois, si vous avez des besoins en termes de graphiques qui ne sont pas couverts par les types de visualisation intégrés de Looker, vous pouvez également ajouter vos propres types de visualisations personnalisées. Vous pouvez également développer une visualisation personnalisée et la mettre à la disposition de tous les utilisateurs de Looker depuis Marketplace Looker.

Les blocs de visualisation sont des types de visualisation JavaScript prédéfinis hébergés par Looker. Vous pouvez ajouter les blocs de visualisation à votre instance Looker. Ils fonctionneront de la même manière que n'importe quel type de visualisation intégré de Looker: ils apparaissent dans la barre de menu des visualisations et ils incluent des fonctionnalités de base telles que l'exploration, le téléchargement, l'intégration et la planification.

Pour en savoir plus sur un bloc de visualisation, sélectionnez le type de visualisation dans la section Plug-ins (Plug-ins) du Marketplace Looker, puis cliquez sur See the Code (Voir le code) et accédez au fichier READ.ME du bloc de visualisation. Le fichier READ.ME montre un exemple de visualisation et donne plus d'informations sur le bloc de visualisation. Pour certaines visualisations, le fichier READ.ME fournit également une URL et des instructions pour ajouter le bloc de visualisation.

Pour ajouter le type de visualisation à votre instance, consultez les instructions dans le fichier READ.ME (le cas échéant) et les informations de notre page de documentation Visualisations.