Chiffrement du trafic réseau
Il est recommandé de chiffrer le trafic réseau entre l'application Looker et votre base de données. Envisagez l'une des options décrites sur la page de documentation Activer l'accès sécurisé à la base de données.
Créer un utilisateur Looker
Looker s'authentifie auprès de Databricks au moyen de jetons d'accès personnels. Suivez la documentation Databricks pour créer un jeton d'accès personnel qu'un utilisateur Databricks peut utiliser dans Looker.
Ajoutez des autorisations à cet utilisateur avec GRANT
.
L'utilisateur Looker doit disposer au minimum de SELECT
et de READ_METADATA
.
GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
Informations sur le serveur
Suivez la documentation Databricks pour trouver le chemin HTTP de votre cluster Databricks. Elle sera désignée par l'expression <YOUR_HTTP_PATH>
sur cette page.
Configurer des tables dérivées persistantes
Pour utiliser des tables dérivées persistantes, créez une base de données distincte.
CREATE DATABASE <YOUR_SCRATCH_DATABASE>
Cela nécessitera également l'octroi d'autorisations utilisateur supplémentaires en écriture.
GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
Créer la connexion Looker à votre base de données
Dans la section Admin de Looker, sélectionnez Connexions, puis cliquez sur Ajouter une connexion.
Saisissez les informations de connexion. La majorité des paramètres sont communs à la plupart des dialectes de base de données. Pour en savoir plus, consultez la page de documentation Connecter Looker à votre base de données. Certains des paramètres sont décrits ci-dessous:
- Name (Nom) : spécifiez le nom de la connexion. Vous utiliserez ce nom pour faire référence à la connexion dans les projets LookML.
- Dialecte: spécifiez le dialecte Databricks.
- Host (Hôte) : spécifiez le nom d'hôte.
- Port: indiquez le port de la base de données. La valeur par défaut est 443.
- Database (Base de données) : spécifiez le nom de la base de données. La valeur par défaut est
default
. - Nom d'utilisateur: saisissez la valeur
token
(ne saisissez pas l'adresse e-mail de l'utilisateur Databricks dans ce champ). - Password (Mot de passe) : saisissez le jeton d'accès personnel créé précédemment.
- Activer les tables dérivées persistantes: utilisez ce bouton pour activer les tables dérivées persistantes. Lorsque les PDT sont activées, la fenêtre Connection (Connexion) affiche des paramètres de PDT supplémentaires et la section PDT Overrides (Remplacements des tables dérivées persistantes).
- Base de données temporaire: saisissez la base de données que vous souhaitez utiliser pour stocker les PDT.
- Nombre maximal de connexions du générateur de PDT: spécifiez le nombre de compilations de PDT simultanées possibles sur cette connexion. Définir cette valeur sur une valeur trop élevée peut avoir un impact négatif sur la durée des requêtes. Pour en savoir plus, consultez la page de documentation Connecter Looker à votre base de données.
Paramètres JDBC supplémentaires: ajoutez d'autres paramètres JDBC Spark.
Planification de maintenance des groupes de données et des tables PDT: expression
cron
qui indique quand Looker doit vérifier les groupes de données et les tables dérivées persistantes. Pour en savoir plus sur ce paramètre, consultez la documentation Calendrier de maintenance des groupes de données et des tables PDT.SSL: cochez cette option pour utiliser des connexions SSL.
Valider SSL: cochez cette option pour appliquer une validation stricte du certificat SSL.
Nombre maximal de connexions par nœud: au départ, vous pouvez conserver la valeur par défaut de ce paramètre. Pour en savoir plus sur ce paramètre, consultez la section Nombre maximal de connexions par nœud de la page de documentation Connecter Looker à votre base de données.
Expiration du pool de connexion: vous pouvez conserver la valeur par défaut de ce paramètre. Pour en savoir plus sur ce paramètre, consultez la section Délai avant expiration du pool de connexion de la page de documentation Connecter Looker à votre base de données.
SQL Runner Precache (Précache de l'exécuteur SQL) : décochez cette option pour empêcher l'exécuteur SQL de précharger les informations de la table et de ne charger ces informations que lorsqu'une table est sélectionnée. Pour en savoir plus sur ce paramètre, consultez la section Mise en cache préalable de l'exécuteur SQL de la page de documentation Connecter Looker à votre base de données.
Fuseau horaire de la base de données: spécifiez le fuseau horaire utilisé dans la base de données. Laissez ce champ vide si vous ne souhaitez pas convertir le fuseau horaire. Pour en savoir plus, consultez la page de documentation Utiliser les paramètres de fuseau horaire.
Cliquez sur Tester pour tester la connexion et vous assurer qu'elle est correctement configurée. Si le message Can Connect (Connexion autorisée) s'affiche, appuyez sur Connect (Se connecter). Les autres tests de connexion sont alors exécutés pour vérifier si le compte de service a été configuré correctement et avec les rôles adéquats. Consultez la page de documentation Tester la connectivité de la base de données pour obtenir des informations de dépannage.
Fonctionnalité Looker avec Databricks Unity Catalog
Pour les connexions Looker à une base de données Databricks avec Unity Catalog activé, la plupart des fonctionnalités Looker n'accèdent qu'aux schémas du catalogue par défaut, comme dans les cas suivants:
- Lors de la génération d'un projet LookML à partir d'un schéma de base de données, Looker crée les fichiers de projet en fonction des tables du catalogue par défaut d'Unity.
- Pour les projets existants, lorsque vous utilisez l'IDE Looker pour créer une vue à partir d'une table, Looker ne peut créer des fichiers de vue qu'à partir des tables du catalogue par défaut d'Unity.
- Lorsque vous utilisez l'exécuteur SQL, vous ne pouvez sélectionner que des schémas dans le catalogue par défaut d'Unity Catalog.
Prise en charge de fonctionnalités
Pour que Looker prenne en charge certaines fonctionnalités, votre dialecte de base de données doit également les prendre en charge.
Databricks prend en charge les fonctionnalités suivantes à partir de Looker 24.6:
Sélection | Compatible ? |
---|---|
Niveau d'assistance | Compatible |
Looker (Google Cloud Core) | Oui |
Agrégations symétriques | Oui |
Tables dérivées | Oui |
Tables dérivées SQL persistantes | Oui |
Tables dérivées natives persistantes | Oui |
Vues stables | Oui |
Arrêt de la requête | Oui |
Tableaux croisés dynamiques basés sur SQL | Oui |
Fuseaux horaires | Oui |
SSL | Oui |
Sous-totaux | Oui |
Paramètres JDBC supplémentaires | Oui |
Sensible à la casse | Oui |
Type d'emplacement | Oui |
Type de liste | Oui |
Centile | Oui |
Centile distinct | Non |
Processus d'affichage de l'exécuteur SQL | Non |
Table de description de l'exécuteur SQL | Oui |
Afficher les index de l'exécuteur SQL | Non |
SQL Runner Select 10 | Oui |
Nombre d'exécuteurs SQL | Oui |
SQL Explain | Oui |
Identifiants OAuth | Non |
Commentaires sur le contexte | Oui |
Pooling de connexions | Non |
Croquis HLL | Non |
Reconnaissance d'agrégats. | Oui |
Augmentation de tables PDT | Oui |
Millisecondes | Oui |
Microsecondes | Oui |
Vues matérialisées | Non |
Nombre approximatif distinct | Non |