Tieni presente che stai visualizzando la documentazione di Looker. Per la documentazione di Looker Studio, visita https://support.google.com/looker-studio.

Apache Spark

Looker si connette ad Apache Spark tramite una connessione JDBC al server Spark Thrift.

Creazione della connessione di Looker al database

Nella sezione Admin (Amministrazione) di Looker, seleziona Connections (Connessioni) e fai clic su Add Connection (Aggiungi connessione).

Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggior parte dei dialetti di database. Per informazioni, consulta la pagina della documentazione Connessione di Looker al tuo database. Di seguito sono descritte alcune delle impostazioni riportate di seguito:

Nome: il nome della connessione. Questo è il modo in cui la connessione verrà indicata nel modello LookML.
Dialect: seleziona Apache Spark 1.5+, Apache Spark 2+ o Apache Spark 3+.
Host: l'host del server Thrift.
Port (Porta del server Thrift): 10.000 per impostazione predefinita.
Database: lo schema/database predefinito che viene modellato. Se non viene specificato alcun database per una tabella, questa verrà presumeta.
Username (Nome utente): l'utente con cui Looker eseguirà l'autenticazione.
Password: la password facoltativa per l'utente di Looker.
Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per abilitare le tabelle derivate persistenti. Quando le PDT sono abilitate, la finestra Connection mostra le impostazioni PDT aggiuntive e la sezione PDT Overrides (Override PDT).
Temp Database (Database temporaneo): uno schema/database temporaneo per l'archiviazione di PDT. Deve essere creato in anticipo con un'istruzione come CREATE SCHEMA looker_scratch;.
Parametri JDBC aggiuntivi. Aggiungi eventuali altri parametri JDBC Hive, ad esempio: ;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
SSL: lascia deselezionata questa opzione.
Fuso orario database: il fuso orario dei dati archiviati in Spark. Di solito può essere lasciato vuoto o impostato su UTC.
Query Time Zone (Fuso orario query): il fuso orario per visualizzare i dati oggetto di query in Looker.

Per verificare che la connessione sia riuscita, fai clic su Prova. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione Testare la connettività dei database.

Per salvare queste impostazioni, fai clic su Connetti.

Assistenza per le funzionalità

Affinché Looker supporti alcune funzionalità, anche il dialetto del tuo database deve supportarle.

Apache Spark 1.5 e versioni successive

Apache Spark 1.5+ supporta le seguenti funzionalità a partire da Looker 23.8:

Funzionalità	Supportato?
Livello di assistenza	Integrazione
Looker (Google Cloud core)	No
Aggregati simmetrici	Sì
Tabelle derivate	Sì
Tabelle derivate permanenti da SQL	Sì
Tabelle derivate native permanenti	Sì
Visualizzazioni stabili	Sì
Termine query	Sì
Pivot basati su SQL	Sì
Fusi orari	Sì
SSL	Sì
Subtotali	Sì
Parametri aggiuntivi JDBC	Sì
Sensibilità alle maiuscole	Sì
Tipo di località	Sì
Tipo di elenco	Sì
Percentile	Sì
Distintivo percentile	No
Processi di visualizzazione di SQL Runner	No
Tabella di descrizione di SQL Runner	Sì
Indici di SQL Runner	Sì
SQL Runner Seleziona 10	Sì
Conteggio SQL Runner	Sì
Spiegazione SQL	Sì
Credenziali OAuth	No
Commenti contestuali	Sì
Pooling della connessione	No
Disegni HLL	No
Aggregate Awareness	Sì
PDT incrementali	No
Millisecondi	Sì
Microsecondi	Sì
Viste materializzate	No
Conteggio approssimativo distinto	No

Apache Spark 2.0

Apache Spark 2.0 supporta le seguenti funzionalità a partire da Looker 23.8:

Funzionalità	Supportato?
Livello di assistenza	Richiesta supportata
Looker (Google Cloud core)	No
Aggregati simmetrici	Sì
Tabelle derivate	Sì
Tabelle derivate permanenti da SQL	Sì
Tabelle derivate native permanenti	Sì
Visualizzazioni stabili	Sì
Termine query	Sì
Pivot basati su SQL	Sì
Fusi orari	Sì
SSL	Sì
Subtotali	Sì
Parametri aggiuntivi JDBC	Sì
Sensibilità alle maiuscole	Sì
Tipo di località	Sì
Tipo di elenco	Sì
Percentile	Sì
Distintivo percentile	No
Processi di visualizzazione di SQL Runner	No
Tabella di descrizione di SQL Runner	Sì
Indici di SQL Runner	No
SQL Runner Seleziona 10	Sì
Conteggio SQL Runner	Sì
Spiegazione SQL	Sì
Credenziali OAuth	No
Commenti contestuali	Sì
Pooling della connessione	No
Disegni HLL	No
Aggregate Awareness	Sì
PDT incrementali	No
Millisecondi	Sì
Microsecondi	Sì
Viste materializzate	No
Conteggio approssimativo distinto	No

Apache Spark 3 e versioni successive

A partire da Looker 23.8, Apache Spark 3+ supporta le seguenti funzionalità:

Funzionalità	Supportato?
Livello di assistenza	Richiesta supportata
Looker (Google Cloud core)	Sì
Aggregati simmetrici	Sì
Tabelle derivate	Sì
Tabelle derivate permanenti da SQL	Sì
Tabelle derivate native permanenti	Sì
Visualizzazioni stabili	Sì
Termine query	Sì
Pivot basati su SQL	Sì
Fusi orari	Sì
SSL	Sì
Subtotali	Sì
Parametri aggiuntivi JDBC	Sì
Sensibilità alle maiuscole	Sì
Tipo di località	Sì
Tipo di elenco	Sì
Percentile	Sì
Distintivo percentile	No
Processi di visualizzazione di SQL Runner	No
Tabella di descrizione di SQL Runner	Sì
Indici di SQL Runner	No
SQL Runner Seleziona 10	Sì
Conteggio SQL Runner	Sì
Spiegazione SQL	Sì
Credenziali OAuth	No
Commenti contestuali	Sì
Pooling della connessione	No
Disegni HLL	No
Aggregate Awareness	Sì
PDT incrementali	No
Millisecondi	Sì
Microsecondi	Sì
Viste materializzate	No
Conteggio approssimativo distinto	No

Passaggi successivi

Dopo aver creato la connessione, imposta le opzioni di autenticazione.