Cette page contient des informations sur la connexion de Looker à Apache Spark 3.
Looker se connecte à Apache Spark 3 ou version ultérieure via une connexion JDBC au serveur Spark Thrift.
Chiffrement du trafic réseau
Il est recommandé de chiffrer le trafic réseau entre l'application Looker et votre base de données. Pour ce faire, consultez les options détaillées sur la page de documentation Sécurisation de l'accès à la base de données.
Créer la connexion Looker à votre base de données
Dans la section Admin de Looker, sélectionnez Connexions, puis cliquez sur Ajouter une connexion.
Saisissez les informations de connexion. La majorité des paramètres sont communs à la plupart des dialectes de base de données. Pour en savoir plus, consultez la page de documentation Connecter Looker à votre base de données. Certains des paramètres sont décrits ci-dessous :
- Nom : nom de la connexion. Il s'agit de la façon dont il sera fait référence à la connexion dans le modèle LookML.
- Dialecte: sélectionnez Apache Spark 3+.
- Hôte : hôte du serveur Thrift.
- Port : port du serveur Thrift (10 000 par défaut).
- Base de données: schéma/base de données par défaut qui sera modélisé. Si aucune base de données n'est spécifiée pour une table, celle-ci sera utilisée par défaut.
- Username (Nom d'utilisateur) : utilisateur sous lequel Looker s'authentifiera.
- Password (Mot de passe) : mot de passe facultatif de l'utilisateur Looker.
- Activer les PDT : utilisez cet interrupteur pour activer les tables dérivées persistantes. Lorsque les PDT sont activés, la fenêtre Connexion affiche des paramètres PDT supplémentaires et la section Remplacements pour les PDT.
- Temp Database (Base de données temporaire) : schéma/base de données temporaire pour le stockage des tables PDT Il doit être créé au préalable, avec une instruction telle que
CREATE SCHEMA looker_scratch;
. - Paramètres JDBC supplémentaires : ajoutez ici les paramètres JDBC Hive supplémentaires, par exemple :
;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
- SSL : laissez cette case décochée.
- Fuseau horaire de la base de données : fuseau horaire des données stockées dans Spark. Vous pouvez généralement ne pas renseigner ce champ ou indiquer l'heure UTC.
- Fuseau horaire de la requête : fuseau horaire à utiliser pour afficher les données interrogées dans Looker.
Pour vérifier que la connexion est établie, cliquez sur Test. Consultez la page de documentation Tester la connectivité de la base de données pour obtenir des informations de dépannage.
Pour enregistrer ces paramètres, cliquez sur Connecter.
Compatibilité des caractéristiques
Pour que Looker prenne en charge certaines fonctionnalités, votre dialecte de base de données doit également les prendre en charge.
Apache Spark 3 ou version ultérieure
Apache Spark 3 et versions ultérieures sont compatibles avec les fonctionnalités suivantes à partir de Looker 24.16 :
Caractéristique | Compatibilité |
---|---|
Niveau d'assistance | Compatible |
Looker (Google Cloud Core) | Oui |
Agrégations symétriques | Oui |
Tables dérivées | Oui |
Tables dérivées SQL persistantes | Oui |
Tables dérivées natives persistantes | Oui |
Vues stables | Oui |
Suppression des requêtes | Oui |
Pivots basés sur SQL | Oui |
Fuseaux horaires | Oui |
SSL | Oui |
Sous-totaux | Oui |
Paramètres JDBC supplémentaires | Oui |
Sensible à la casse | Oui |
Type d'emplacement | Oui |
Type de liste | Oui |
Centile | Oui |
Centile distinct | Non |
Processus d'affichage de l'exécuteur SQL | Non |
Table de description de SQL Runner | Oui |
Indexes de l'exécuteur SQL | Non |
SQL Runner Select 10 | Oui |
Nombre d'exécuteurs SQL | Oui |
SQL Explain | Oui |
Identifiants OAuth | Non |
Commentaires sur le contexte | Oui |
Pooling des connexions | Non |
HLL Sketches | Non |
Reconnaissance d'agrégats. | Oui |
Augmentation de tables PDT | Non |
Millisecondes | Oui |
Microsecondes | Oui |
Vues matérialisées | Non |
Nombre approximatif distinct | Non |
Étapes suivantes
Après avoir créé la connexion, définissez les options d'authentification.