Databricks

Crittografia del traffico di rete

Una delle best practice consiste nel criptare il traffico di rete tra l'applicazione Looker e il tuo database. Valuta una delle opzioni descritte nella pagina della documentazione Abilitazione dell'accesso sicuro al database.

Crea un utente di Looker

Looker autentica in Databricks tramite token di accesso personale. Segui la documentazione di Databricks per creare un token di accesso personale che un utente Databricks possa utilizzare in Looker.

Aggiungi autorizzazioni a questo utente con GRANT.

L'utente di Looker deve avere almeno SELECT e READ_METADATA.

GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`

Informazioni sul server

Segui la documentazione di Databricks per trovare il percorso HTTP per il cluster Databricks. Ci riferiremo a questo elemento come <YOUR_HTTP_PATH> in questa pagina.

Configurazione delle tabelle derivate permanenti

Per utilizzare le tabelle derivate permanenti, crea un database separato.

CREATE DATABASE <YOUR_SCRATCH_DATABASE>

Per farlo, saranno necessarie ulteriori autorizzazioni utente basate sulla scrittura.

GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`

Creazione della connessione Looker al tuo database

Nella sezione Admin (Amministrazione) di Looker, seleziona Connections (Connessioni) e fai clic su Add Connection (Aggiungi connessione).

Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggior parte dei dialetti del database. Per informazioni, consulta la pagina della documentazione Connessione di Looker al tuo database. Alcune di queste impostazioni sono descritte di seguito:

  • Nome: specifica il nome della connessione. Ecco come farai riferimento alla connessione nei progetti LookML.
  • Dialect: specifica il dialetto Databricks.
  • Host: specifica il nome host.
  • Porta: specifica la porta del database. Il valore predefinito è 443.
  • Database: specifica il nome del database. Il valore predefinito è default.
  • Nome utente: inserisci il valore token (non inserire l'email dell'utente Databricks in questo campo).
  • Password: inserisci il token di accesso personale creato in precedenza.
  • Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per abilitare le tabelle derivate permanenti. Quando le PDT sono abilitate, la finestra Connessione mostra le impostazioni PDT aggiuntive e la sezione Override PDT.
  • Database temporaneo: inserisci il database che vuoi utilizzare per archiviare le PDT.
  • Numero massimo di connessioni del builder di PDT: specifica il numero di possibili build di PDT simultanee su questa connessione. L'impostazione di questo valore troppo alto potrebbe influire negativamente sui tempi di query. Per saperne di più, consulta la pagina della documentazione Connessione di Looker al tuo database.
  • Parametri JDBC aggiuntivi: aggiungi eventuali parametri JDBC di Spark aggiuntivi.

  • Pianificazione della manutenzione di gruppi di dati e PDT: un'espressione cron che indica quando Looker deve controllare i gruppi di dati e le tabelle derivate permanenti. Scopri di più su questa impostazione nella documentazione relativa alla pianificazione della manutenzione di gruppi di dati e PDT.

  • SSL: seleziona questa opzione per utilizzare le connessioni SSL.

  • Verifica SSL: seleziona questa opzione per applicare la verifica rigorosa del certificato SSL.

  • Numero massimo di connessioni per nodo: puoi lasciare inizialmente il valore predefinito di questa impostazione. Scopri di più su questa impostazione nella sezione Numero massimo di connessioni per nodo della pagina della documentazione Connessione di Looker al tuo database.

  • Timeout del pool di connessioni: inizialmente puoi lasciare invariato il valore predefinito di questa impostazione. Scopri di più su questa impostazione nella sezione Timeout del pool di connessioni nella pagina della documentazione Connessione di Looker al database.

  • Pre-cache di SQL Runner: deseleziona questa opzione per impedire a SQL Runner di precaricare le informazioni sulle tabelle e di caricarle solo quando è selezionata una tabella. Scopri di più su questa impostazione nella sezione Precache di SQL Runner della pagina della documentazione Connessione di Looker al tuo database.

  • Fuso orario database: specifica il fuso orario utilizzato nel database. Lascia vuoto questo campo se non vuoi la conversione del fuso orario. Per ulteriori informazioni, consulta la pagina della documentazione relativa all'utilizzo delle impostazioni del fuso orario.

Fai clic su Test per verificare la connessione e assicurarti che sia configurata correttamente. Se vedi l'opzione Può connettersi, premi Connetti. Questa operazione esegue gli altri test della connessione per verificare che l'account di servizio sia stato configurato correttamente e con i ruoli appropriati. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione relativa ai test di connettività dei database.

Funzionalità di Looker con Databricks Unity Catalog

Per le connessioni di Looker a un database Databricks con il catalogo Unity abilitato, la maggior parte delle funzionalità di Looker accederà agli schemi solo dal catalogo predefinito, come nei seguenti scenari:

  • Quando generi un nuovo progetto LookML dallo schema di database, Looker crea i file di progetto in base alle tabelle nel catalogo predefinito del catalogo Unity.
  • Per i progetti esistenti, quando utilizzi l'IDE Looker per creare una vista da una tabella, Looker può creare file di visualizzazione solo dalle tabelle nel catalogo predefinito del catalogo Unity.
  • Quando utilizzi SQL Runner, puoi selezionare solo schemi dal catalogo predefinito del catalogo Unity.

Supporto delle funzionalità

Affinché Looker possa supportare alcune funzionalità, è necessario che anche il dialetto del database le supporti.

Databricks supporta le seguenti funzionalità a partire da Looker 24.8:

Selezione delle Supportato?
Livello di assistenza
Supportato
Looker (Google Cloud core)
Aggregati simmetrici
Tabelle derivate
Tabelle derivate SQL permanenti
Tabelle derivate native permanenti
Visualizzazioni stabili
Eliminazione delle query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Percentile distinto
No
Processi di visualizzazione SQL Runner
No
Descrivi tabella SQL Runner
Indici di visualizzazione SQL Runner
No
SQL Runner Select 10
Conteggio esecutori SQL
Spiegazione SQL
Credenziali OAuth
No
Commenti contestuali
Pooling di connessioni
No
Schizzi HLL
No
Awareness aggregato
PDT incrementali
Millisecondi
Microsecondi
Viste materializzate
No
Conteggio approssimativo distinto
No