Questa pagina contiene informazioni su come collegare Looker ad Apache Spark 3.
Looker si connette ad Apache Spark 3 e versioni successive tramite una connessione JDBC al server Spark Thrift.
Crittografia del traffico di rete in corso...
È buona prassi criptare il traffico di rete tra l'applicazione Looker e il database. Prendi in considerazione una delle opzioni descritte nella pagina della documentazione Abilitazione dell'accesso sicuro al database.
Creazione della connessione di Looker al database
Nella sezione Admin (Amministrazione) di Looker, seleziona Connections (Connessioni) e quindi fai clic su Add Connection (Aggiungi connessione).
Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggior parte dei dialetti dei database. Per informazioni, consulta la pagina della documentazione Collegamento di Looker al tuo database. Di seguito sono descritte alcune delle impostazioni:
- Nome: il nome della connessione. Questo è il nome della connessione nel modello LookML.
- Dialetto: seleziona Apache Spark 3 o versioni successive.
- Host: l'host del server Thrift.
- Porta La porta del server Thrift (10000 per impostazione predefinita).
- Database: lo schema o il database predefinito che verrà modellato. Se non viene specificato alcun database per una tabella, verrà assunto questo valore.
- Nome utente: l'utente con cui Looker eseguirà l'autenticazione.
- Password: la password facoltativa per l'utente di Looker.
- Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per attivare le tabelle derivate permanenti. Quando le PDT sono abilitate, la finestra Connection mostra le impostazioni PDT aggiuntive e la sezione PDT Overrides.
- Database temporaneo: uno schema/database temporaneo per l'archiviazione delle PDT. Deve essere creato in precedenza, con un'istruzione come
CREATE SCHEMA looker_scratch;
. - Parametri JDBC aggiuntivi: aggiungi qui ulteriori parametri JDBC Hive, ad esempio:
;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
- SSL: lascia questa opzione deselezionata.
- Database Time Zone: il fuso orario dei dati archiviati in Spark. In genere, può essere lasciato vuoto o impostato su UTC.
- Fuso orario query: il fuso orario per visualizzare i dati sottoposti a query in Looker.
Per verificare che la connessione sia andata a buon fine, fai clic su Test. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione Testare la connettività del database.
Per salvare queste impostazioni, fai clic su Connetti.
Funzionalità supportate
Affinché Looker supporti alcune funzionalità, anche il dialetto del database deve supportarle.
Apache Spark 3 e versioni successive
Apache Spark 3 e versioni successive supportano le seguenti funzionalità a partire da Looker 24.16:
Funzionalità | Supportata? |
---|---|
Livello di assistenza | Supportato |
Looker (Google Cloud core) | Sì |
Aggregati simmetrici | Sì |
Tabelle derivate | Sì |
Tabelle derivate SQL permanenti | Sì |
Tabelle derivate native permanenti | Sì |
Visualizzazioni stabili | Sì |
Interruzioni delle query | Sì |
Pivot basati su SQL | Sì |
Fusi orari | Sì |
SSL | Sì |
Subtotali | Sì |
Parametri aggiuntivi JDBC | Sì |
Sensibilità alle maiuscole | Sì |
Tipo di località | Sì |
Tipo di elenco | Sì |
Percentile | Sì |
Percentile distinto | No |
Processi di visualizzazione di SQL Runner | No |
Tabella di descrizione di SQL Runner | Sì |
Indici delle visualizzazioni di SQL Runner | No |
Selezione SQL Runner 10 | Sì |
Conteggio runner SQL | Sì |
SQL Explain | Sì |
Credenziali OAuth | No |
Commenti contestuali | Sì |
Pool di connessioni | No |
Schizzi HLL | No |
Consapevolezza aggregata | Sì |
PDT incrementali | No |
Millisecondi | Sì |
Microsecondi | Sì |
Viste materializzate | No |
Conteggio approssimativo valori distinti | No |
Passaggi successivi
Dopo aver creato la connessione, imposta le opzioni di autenticazione.