Apache Spark

Looker si connette ad Apache Spark tramite una connessione JDBC al server Spark Thrift.

Creazione della connessione di Looker al database

Nella sezione Admin (Amministrazione) di Looker, seleziona Connections (Connessioni) e fai clic su Add Connection (Aggiungi connessione).

Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggior parte dei dialetti di database. Per informazioni, consulta la pagina della documentazione Connessione di Looker al tuo database. Di seguito sono descritte alcune delle impostazioni riportate di seguito:

  • Nome: il nome della connessione. Questo è il modo in cui la connessione verrà indicata nel modello LookML.
  • Dialect: seleziona Apache Spark 1.5+, Apache Spark 2+ o Apache Spark 3+.
  • Host: l'host del server Thrift.
  • Port (Porta del server Thrift): 10.000 per impostazione predefinita.
  • Database: lo schema/database predefinito che viene modellato. Se non viene specificato alcun database per una tabella, questa verrà presumeta.
  • Username (Nome utente): l'utente con cui Looker eseguirà l'autenticazione.
  • Password: la password facoltativa per l'utente di Looker.
  • Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per abilitare le tabelle derivate persistenti. Quando le PDT sono abilitate, la finestra Connection mostra le impostazioni PDT aggiuntive e la sezione PDT Overrides (Override PDT).
  • Temp Database (Database temporaneo): uno schema/database temporaneo per l'archiviazione di PDT. Deve essere creato in anticipo con un'istruzione come CREATE SCHEMA looker_scratch;.
  • Parametri JDBC aggiuntivi. Aggiungi eventuali altri parametri JDBC Hive, ad esempio: ;spark.sql.inMemoryColumnarStorage.compressed=true
    ;auth=noSasl
  • SSL: lascia deselezionata questa opzione.
  • Fuso orario database: il fuso orario dei dati archiviati in Spark. Di solito può essere lasciato vuoto o impostato su UTC.
  • Query Time Zone (Fuso orario query): il fuso orario per visualizzare i dati oggetto di query in Looker.

Per verificare che la connessione sia riuscita, fai clic su Prova. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione Testare la connettività dei database.

Per salvare queste impostazioni, fai clic su Connetti.

Assistenza per le funzionalità

Affinché Looker supporti alcune funzionalità, anche il dialetto del tuo database deve supportarle.

Apache Spark 1.5 e versioni successive

Apache Spark 1.5+ supporta le seguenti funzionalità a partire da Looker 23.8:

Funzionalità Supportato?
Livello di assistenza
Integrazione
Looker (Google Cloud core)
No
Aggregati simmetrici
Tabelle derivate
Tabelle derivate permanenti da SQL
Tabelle derivate native permanenti
Visualizzazioni stabili
Termine query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Distintivo percentile
No
Processi di visualizzazione di SQL Runner
No
Tabella di descrizione di SQL Runner
Indici di SQL Runner
SQL Runner Seleziona 10
Conteggio SQL Runner
Spiegazione SQL
Credenziali OAuth
No
Commenti contestuali
Pooling della connessione
No
Disegni HLL
No
Aggregate Awareness
PDT incrementali
No
Millisecondi
Microsecondi
Viste materializzate
No
Conteggio approssimativo distinto
No

Apache Spark 2.0

Apache Spark 2.0 supporta le seguenti funzionalità a partire da Looker 23.8:

Funzionalità Supportato?
Livello di assistenza
Richiesta supportata
Looker (Google Cloud core)
No
Aggregati simmetrici
Tabelle derivate
Tabelle derivate permanenti da SQL
Tabelle derivate native permanenti
Visualizzazioni stabili
Termine query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Distintivo percentile
No
Processi di visualizzazione di SQL Runner
No
Tabella di descrizione di SQL Runner
Indici di SQL Runner
No
SQL Runner Seleziona 10
Conteggio SQL Runner
Spiegazione SQL
Credenziali OAuth
No
Commenti contestuali
Pooling della connessione
No
Disegni HLL
No
Aggregate Awareness
PDT incrementali
No
Millisecondi
Microsecondi
Viste materializzate
No
Conteggio approssimativo distinto
No

Apache Spark 3 e versioni successive

A partire da Looker 23.8, Apache Spark 3+ supporta le seguenti funzionalità:

Funzionalità Supportato?
Livello di assistenza
Richiesta supportata
Looker (Google Cloud core)
Aggregati simmetrici
Tabelle derivate
Tabelle derivate permanenti da SQL
Tabelle derivate native permanenti
Visualizzazioni stabili
Termine query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Distintivo percentile
No
Processi di visualizzazione di SQL Runner
No
Tabella di descrizione di SQL Runner
Indici di SQL Runner
No
SQL Runner Seleziona 10
Conteggio SQL Runner
Spiegazione SQL
Credenziali OAuth
No
Commenti contestuali
Pooling della connessione
No
Disegni HLL
No
Aggregate Awareness
PDT incrementali
No
Millisecondi
Microsecondi
Viste materializzate
No
Conteggio approssimativo distinto
No

Passaggi successivi

Dopo aver creato la connessione, imposta le opzioni di autenticazione.