Notez que vous consultez la documentation Looker. Pour accéder à la documentation sur Looker Studio, consultez la page https://support.google.com/looker-studio.

Databricks

Créer un utilisateur Looker

Looker s'authentifie sur Databricks à l'aide de jetons d'accès personnels. Suivez la documentation de Databricks afin de créer un jeton d'accès personnel pour un utilisateur de Databricks à utiliser dans Looker.

Ajoutez des autorisations à cet utilisateur avec GRANT.

L'utilisateur Looker doit au minimum disposer de SELECT et READ_METADATA.

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

Informations sur le serveur

Suivez la documentation de Databricks pour trouver le chemin d'accès HTTP correspondant à votre cluster Databricks. Cette adresse est désignée par le terme <YOUR_HTTP_PATH> sur cette page.

Configurer des tables dérivées persistantes

Pour utiliser des tables dérivées persistantes, créez une base de données distincte.

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

Vous devrez également accorder des autorisations utilisateur basées sur l'écriture.

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

Créer la connexion Looker à votre base de données

Dans la section Administration de Looker, sélectionnez Connexions, puis cliquez sur Ajouter une connexion.

Saisissez les informations de connexion. La majorité des paramètres sont communs à la plupart des dialectes de base de données. Pour en savoir plus, consultez la page de documentation Connecter Looker à votre base de données. Certains des paramètres sont décrits ci-dessous:

Name (Nom) : spécifiez le nom de la connexion. Vous trouverez ci-dessous la référence à la connexion dans les projets LookML.
Dialect: spécifiez le dialecte Databricks.
Host (Hôte) : spécifiez le nom d'hôte.
Port: spécifiez le port de la base de données. La valeur par défaut est 443.
Base de données: spécifiez le nom de la base de données. La valeur par défaut est default.
Nom d'utilisateur: saisissez la valeur token (ne saisissez pas l'adresse e-mail de l'utilisateur Databricks dans ce champ).
Password (Mot de passe) : saisissez le jeton d'accès personnel créé précédemment.
Activer les tables dérivées persistantes: utilisez ce bouton pour activer les tables dérivées persistantes. Lorsque les tables dérivées persistantes sont activées, la fenêtre Connexion affiche les paramètres supplémentaires des tables dérivées persistantes, ainsi que la section Remplacements pour les PDT.
Temp Database (Base de données temporaire) : saisissez la base de données que vous souhaitez utiliser pour stocker les tables dérivées persistantes.
Nombre maximal de connexions du générateur PDT: spécifiez le nombre de générations de PDT simultanées possibles sur cette connexion. Définir une valeur trop élevée peut avoir un impact négatif sur le temps d'interrogation. Pour en savoir plus, consultez la page de documentation Connecter Looker à votre base de données.
Paramètres JDBC supplémentaires: ajoutez d'autres paramètres JDBC Spark.

Remarque :Les paramètres suivants sont obligatoires: transportMode=http;httpPath=<YOUR_HTTP_PATH>
Calendrier de maintenance des groupes de données et des tables dérivées persistantes: expression cron qui indique quand Looker doit vérifier les groupes de données et les tables dérivées persistantes. Pour en savoir plus sur ce paramètre, consultez la documentation Calendrier de maintenance des groupes de données et des tables dérivées persistantes.

Avertissement :La valeur par défaut pour le calendrier de maintenance des groupes de données et des tables dérivées persistantes est de cinq minutes. Si vous conservez la valeur par défaut, Looker appellera votre base de données Databricks toutes les cinq minutes. Cette fréquence peut empêcher l'arrêt des clusters Databricks, ce qui peut entraîner des coûts inattendus. Pour éviter ces coûts, envisagez de définir un intervalle moins fréquent par défaut.
SSL: cochez cette case pour utiliser des connexions SSL.
Vérifier la conformité de la norme SSL: cochez cette option pour appliquer la vérification stricte du certificat SSL.
Nombre maximal de connexions par nœud: vous pouvez laisser la valeur par défaut initiale pour ce paramètre. Pour en savoir plus sur ce paramètre, consultez la section Nombre maximal de connexions par nœud de la page de documentation Connecter Looker à votre base de données.
Expiration du pool de connexions: vous pouvez conserver la valeur par défaut de ce paramètre. Pour en savoir plus sur ce paramètre, consultez la section Délai d'expiration du pool de connexions de la page de documentation Connecter Looker à votre base de données.
Préchargement d'exécuteur SQL: permet de décocher l'option permettant de ne pas précharger les informations d'une table et de ne les charger que lorsqu'une table est sélectionnée. Pour en savoir plus sur ce paramètre, consultez la section Precache Runner SQL de la page de documentation Connecter Looker à votre base de données.
Database Time Zone (Fuseau horaire de la base de données) : spécifiez le fuseau horaire utilisé dans la base de données. Laissez ce champ vide si vous ne souhaitez pas convertir les fuseaux horaires. Pour en savoir plus, consultez la page Utiliser les paramètres de fuseau horaire.

Cliquez sur Tester pour tester la connexion et vous assurer qu'elle est correctement configurée. Si le message Connexion possible s'affiche, appuyez sur Connecter. Les autres tests de connexion sont alors exécutés pour vérifier si le compte de service a été configuré correctement et avec les rôles adéquats. Pour en savoir plus sur le dépannage, consultez la page de test de la connectivité de la base de données.

Fonctionnalités Looker avec le catalogue Unity Databricks

Looker n'est pas compatible avec le catalogue Unity de Databricks. Pour les connexions Looker à une base de données Databricks dans laquelle Unity Catalog est activé, la plupart des fonctionnalités Looker n'accèdent aux schémas qu'à partir du catalogue par défaut, comme dans les scénarios suivants:

Lorsque vous générez un projet LookML à partir d'un schéma de base de données, Looker crée les fichiers du projet en fonction des tables du catalogue Unity Catalog par défaut.
Pour les projets existants, lorsque vous utilisez l'IDE Looker pour créer une vue à partir d'une table, Looker ne peut créer des fichiers de vue qu'à partir des tables du catalogue Unity Catalog par défaut.
Lorsque vous utilisez l'exécuteur SQL, vous ne pouvez sélectionner que des schémas dans le catalogue par défaut du catalogue Unity.

Prise en charge de fonctionnalités

Pour que Looker prenne en charge certaines fonctionnalités, votre dialecte de base de données doit également les prendre en charge.

Databricks est compatible avec les fonctionnalités suivantes à partir de Looker 23.8:

Caractéristique	Compatible ?
Niveau d'assistance	Compatible
Looker (Google Cloud Core)	Oui
Agrégations symétriques	Oui
Tables dérivées	Oui
Tables dérivées SQL persistantes	Oui
Tables dérivées natives persistantes	Oui
Vues stables	Oui
Arrêt des requêtes	Oui
Pivots basés sur SQL	Oui
Fuseaux horaires	Oui
SSL	Oui
Sous-totaux	Oui
Paramètres JDBC supplémentaires	Oui
Sensible à la casse	Oui
Type d'emplacement	Oui
Type de liste	Oui
Centile	Oui
Centile distinct	Non
Processus d'affichage de l'exécuteur SQL	Non
Table "Décrire" de l'exécuteur SQL	Oui
Index d'émissions SQL Runner	Non
Exécuteur SQL 10	Oui
Nombre d'exécuteurs SQL	Oui
SQL Explain	Oui
Identifiants OAuth	Non
Commentaires contextuels	Oui
Pooling de connexions	Non
croquis HLL	Non
Reconnaissance d'agrégats.	Oui
Augmentation de tables PDT	Oui
Millisecondes	Oui
Microsecondes	Oui
Vues matérialisées	Non
Nombre approximatif distinct	Non