Questa pagina contiene informazioni sulla connessione di Looker ad Apache Spark 3.
Looker si connette ad Apache Spark 3 e versioni successive tramite una connessione JDBC a Spark Thrift Server.
Crittografia del traffico di rete
Una delle best practice consiste nel criptare il traffico di rete tra l'applicazione Looker e il tuo database. Valuta una delle opzioni descritte nella pagina della documentazione Abilitazione dell'accesso sicuro al database.
Creazione della connessione Looker al tuo database
Nella sezione Admin (Amministrazione) di Looker, seleziona Connections (Connessioni) e fai clic su Add Connection (Aggiungi connessione).
Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggior parte dei dialetti del database. Per informazioni, consulta la pagina della documentazione Connessione di Looker al tuo database. Alcune di queste impostazioni sono descritte di seguito:
- Nome: il nome della connessione. Ecco come verrà definita la connessione nel modello LookML.
- Dialect: seleziona Apache Spark 3+.
- Host: l'host del server Thrift.
- Porta: la porta del server Thrift (10000 per impostazione predefinita).
- Database: lo schema/database predefinito che verrà modellato. Se non viene specificato alcun database per una tabella, viene usato questo valore.
- Nome utente: l'utente con cui Looker eseguirà l'autenticazione.
- Password: la password facoltativa per l'utente di Looker.
- Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per abilitare le tabelle derivate permanenti. Quando le PDT sono abilitate, la finestra Connessione mostra le impostazioni PDT aggiuntive e la sezione Override PDT.
- Database temporaneo: uno schema/database temporaneo per l'archiviazione delle PDT. Deve essere creato preventivamente, con un'istruzione come
CREATE SCHEMA looker_scratch;
. - Parametri JDBC aggiuntivi: aggiungi eventuali parametri JDBC di Hive aggiuntivi qui, ad esempio:
;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
- SSL: lascia questa opzione deselezionata.
- Database Time Zone (Fuso orario database): il fuso orario dei dati archiviati in Spark. Di solito può essere lasciato vuoto o impostato su UTC.
- Query Time Zone (Fuso orario query): il fuso orario per visualizzare i dati sottoposti a query in Looker.
Per verificare che la connessione venga stabilita, fai clic su Prova. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione relativa ai test di connettività dei database.
Per salvare queste impostazioni, fai clic su Connetti.
Supporto delle funzionalità
Affinché Looker possa supportare alcune funzionalità, è necessario che anche il dialetto del database le supporti.
Apache Spark 3 e versioni successive
Apache Spark 3 e versioni successive supporta le seguenti funzionalità a partire da Looker 24.8:
Selezione delle | Supportato? |
---|---|
Livello di assistenza | Supportato |
Looker (Google Cloud core) | Sì |
Aggregati simmetrici | Sì |
Tabelle derivate | Sì |
Tabelle derivate SQL permanenti | Sì |
Tabelle derivate native permanenti | Sì |
Visualizzazioni stabili | Sì |
Eliminazione delle query | Sì |
Pivot basati su SQL | Sì |
Fusi orari | Sì |
SSL | Sì |
Subtotali | Sì |
Parametri aggiuntivi JDBC | Sì |
Sensibilità alle maiuscole | Sì |
Tipo di località | Sì |
Tipo di elenco | Sì |
Percentile | Sì |
Percentile distinto | No |
Processi di visualizzazione SQL Runner | No |
Descrivi tabella SQL Runner | Sì |
Indici di visualizzazione SQL Runner | No |
SQL Runner Select 10 | Sì |
Conteggio esecutori SQL | Sì |
Spiegazione SQL | Sì |
Credenziali OAuth | No |
Commenti contestuali | Sì |
Pooling di connessioni | No |
Schizzi HLL | No |
Awareness aggregato | Sì |
PDT incrementali | No |
Millisecondi | Sì |
Microsecondi | Sì |
Viste materializzate | No |
Conteggio approssimativo distinto | No |
Passaggi successivi
Dopo aver creato la connessione, imposta le opzioni di autenticazione.