Apache Spark

Questa pagina contiene informazioni sulla connessione di Looker ad Apache Spark 3.

Looker si connette ad Apache Spark 3 e versioni successive tramite una connessione JDBC a Spark Thrift Server.

Crittografia del traffico di rete in corso...

Una best practice consiste nel criptare il traffico di rete tra l'applicazione Looker e il tuo database. Prendi in considerazione una delle opzioni descritte nella pagina della documentazione Abilitazione dell'accesso sicuro al database.

Creazione della connessione Looker al tuo database

Nella sezione Admin (Amministrazione) di Looker, seleziona Connections (Connessioni) e quindi fai clic su Add Connection (Aggiungi connessione).

Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggior parte dei dialetti dei database. Per informazioni, consulta la pagina della documentazione Collegamento di Looker al tuo database. Di seguito sono descritte alcune delle impostazioni:

  • Nome: il nome della connessione. Questo è il nome della connessione nel modello LookML.
  • Dialetto: seleziona Apache Spark 3 o versioni successive.
  • Host: l'host del server Thrift.
  • Porta: la porta del server Thrift (10000 per impostazione predefinita).
  • Database: lo schema o il database predefinito che verrà modellato. Questo valore viene utilizzato quando per una tabella non viene specificato alcun database.
  • Nome utente: l'utente con cui Looker eseguirà l'autenticazione.
  • Password: la password facoltativa per l'utente Looker.
  • Abilita le PDT: utilizza questa opzione per abilitare le tabelle derivate permanenti. Quando le PDT sono abilitate, la finestra Connection mostra le impostazioni PDT aggiuntive e la sezione PDT Overrides.
  • Database temporaneo: uno schema/database temporaneo per l'archiviazione delle PDT. Deve essere creato preventivamente, con un'istruzione come CREATE SCHEMA looker_scratch;.
  • Parametri JDBC aggiuntivi: aggiungi qui eventuali altri parametri JDBC Hive, ad esempio:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: lascia deselezionata questa opzione.
  • Database Time Zone: il fuso orario dei dati archiviati in Spark. In genere, può essere lasciato vuoto o impostato su UTC.
  • Fuso orario query: il fuso orario per visualizzare i dati oggetto della query in Looker.

Per verificare che la connessione sia andata a buon fine, fai clic su Test. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione relativa al test della connettività del database.

Per salvare queste impostazioni, fai clic su Connetti.

Supporto delle funzionalità

Affinché Looker supporti alcune funzionalità, è necessario che anche il dialetto del tuo database le supporti.

Apache Spark 3 e versioni successive

Apache Spark 3 e versioni successive supporta le seguenti funzionalità a partire da Looker 24.10:

Selezione delle Supportata?
Livello di assistenza
Supportato
Looker (Google Cloud core)
Aggregati simmetrici
Tabelle derivate
Tabelle derivate da SQL permanente
Tabelle derivate native permanenti
Viste stabili
Eliminazione delle query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Percentile distinto
No
Processi SQL Runner Show
No
Tabella di descrizione di SQL Runner
SQL Runner Mostra indici
No
Selezione SQL Runner 10
Conteggio runner SQL
Spiegazione SQL
Credenziali OAuth
No
Commenti contestuali
Pooling di connessioni
No
Schizzi HLL
No
Consapevolezza aggregata
PDT incrementali
No
Millisecondi
Microsecondi
Viste materializzate
No
Conteggio approssimato distinto
No

Passaggi successivi

Dopo aver creato la connessione, imposta le opzioni di autenticazione.