PrestoDB e Trino

Queste pagine spiegano come collegare Looker a PrestoDB o Trino.

Crittografia del traffico di rete

È buona prassi criptare il traffico di rete tra l'applicazione Looker e il database. Valuta la possibilità di utilizzare una delle opzioni descritte nella pagina della documentazione Abilitare l'accesso sicuro ai database.

Creazione della connessione di Looker al database

Nella sezione Amministrazione di Looker, seleziona Connessioni e poi fai clic su Aggiungi connessione.

Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggior parte dei dialetti di database. Per informazioni, consulta la pagina della documentazione Connessione di Looker al tuo database. Di seguito sono descritte alcune impostazioni:

  • Dialetto: seleziona PrestoDB o Trino.

    PrestoSQL è stato rinominato Trino. Se utilizzi una versione di Trino precedente alla 352, seleziona PrestoSQL dal menu dei dialetti di Looker.

  • Host: il nome host del database.

  • Porta: la porta del database. La porta predefinita è 8080.

  • Database: il "catalogo" o il "connettore", in termini di Presto.

  • Nome utente: il nome utente dell'utente che eseguirà le query.

    Queste informazioni vengono inviate al server di database solo se è attivato SSL.

  • Password: la password dell'utente che eseguirà le query.

    Queste informazioni vengono inviate al server di database solo se è attivato SSL.

  • Schema: lo schema predefinito da utilizzare quando non viene specificato alcuno schema.

  • Autenticazione: seleziona Account database o OAuth:

    • Utilizza Account database per specificare il nome utente e la password dell'account utente del database che verrà utilizzato per connettersi a Looker.
    • Utilizza OAuth se vuoi configurare OAuth per la connessione.
  • Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per attivare le tabelle derivate permanenti (PDT). Vengono visualizzati ulteriori campi PDT e la sezione Override PDT per la connessione.

  • Database temporaneo: lo schema per scrivere le PDT. La versione 3.50 ha aggiunto il supporto del fuso orario PDT a Presto. Per saperne di più su come configurare Presto per il supporto dei PDT, consulta la sezione Configurare PrestoDB o Trino per i PDT in questa pagina.

  • Parametri JDBC aggiuntivi: eventuali parametri aggiuntivi del driver JDBC PrestoDB, del driver JDBC Trino o del driver JDBC Starburst.

  • SSL: seleziona questa opzione per attivare le connessioni SSL.

  • Verifica SSL: ignora questo campo. Tutte le connessioni SSL utilizzeranno il Truststore Java predefinito, a meno che non venga indicato diversamente con i parametri JDBC di PrestoDB, il driver JDBC di Trino o il driver JDBC di Starburst. Inserisci questi parametri nel campo Parametri JDBC aggiuntivi.

Per verificare che la connessione sia andata a buon fine, fai clic su Test. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione Testare la connettività del database.

Per salvare queste impostazioni, fai clic su Connetti.

Per ulteriori informazioni sulle impostazioni di connessione, consulta la pagina della documentazione Connessione di Looker al database.

Configurazione di PrestoDB o Trino per i PDT

Le PDT non sono supportate per le connessioni che utilizzano OAuth.

Il supporto del PDT dipende dal connettore che utilizzi con PrestoDB o Trino . Questa sezione illustra le impostazioni di configurazione necessarie per un database scratch. Questo esempio presuppone che il connettore in uso sia hive.

Il file delle proprietà del catalogo Hive deve contenere alcune proprietà di configurazione, descritte in questa sezione.

I seguenti requisiti sono obbligatori perché Presto memorizza nella cache i risultati del metastore Hive e Looker deve essere in grado di vedere immediatamente le tabelle:

hive.metastore-cache-ttl = 0s

Queste due proprietà sono obbligatorie perché Looker deve essere in grado di inserire e rinominare le PDT:

hive.allow-rename-table=true
hive.allow-drop-table=true

Come riferimento, nei nostri server di test Presto interni utilizziamo il seguente file hive.properties, che viene utilizzato per tutti gli schemi Hive:

hive.s3.connect-timeout=1m
hive.s3.max-backoff-time=10m
hive.s3.max-error-retries=50
hive.metastore-cache-ttl = 0s
hive.metastore-refresh-interval = 5s
hive.s3.max-connections=500
hive.s3.max-client-retries=50
connector.name=hive-hadoop2
hive.s3.socket-timeout=2m
hive.s3.staging-directory=/mnt/tmp/
hive.s3.use-instance-credentials=true
hive.config.resources=/etc/hadoop/conf/core-site.xml,/etc/hadoop/conf/hdfs-site.xml
hive.parquet.use-column-names=true
hive.allow-drop-table=true
hive.metastore.uri=thrift://<metastore-server>:9083
hive.storage-format=ORC
hive.allow-rename-table=true

Configurazione di OAuth per le connessioni Trino

Looker supporta OAuth per le connessioni Trino, il che significa che ogni utente di Looker si autentica nel database e autorizza Looker a eseguire query sul database con il proprio account utente OAuth.

OAuth consente agli amministratori del database di eseguire le seguenti attività:

  • Controlla quali utenti di Looker eseguono query sul database
  • Applicare controlli dell'accesso basati sui ruoli utilizzando le autorizzazioni a livello di database
  • Utilizza i token OAuth per tutte le procedure e le azioni che accedono al database, anziché incorporare ID e password del database in più posizioni
  • Revocare l'autorizzazione per un determinato utente direttamente tramite il database

Con le connessioni Trino che utilizzano OAuth, gli utenti devono accedere di nuovo periodicamente quando i token OAuth scadono.

Tieni presente quanto segue per le connessioni OAuth a livello di database:

  • Se un utente lascia scadere il token OAuth, tutte le pianificazioni o gli avvisi di sua proprietà saranno interessati. Per evitare questo problema, Looker invierà un'email di notifica al proprietario di ogni pianificazione e di ogni avviso prima della scadenza dell'attuale token OAuth attivo. Looker invierà queste email di notifica 14 giorni, 7 giorni e 1 giorno prima della scadenza del token. L'utente può accedere alla propria pagina utente di Looker per autorizzare nuovamente Looker al database ed evitare interruzioni delle pianificazioni e degli avvisi. Per maggiori dettagli, consulta la pagina della documentazione Personalizzare le impostazioni dell'account utente.
  • Poiché le connessioni al database che utilizzano OAuth sono "per utente", anche i criteri di memorizzazione nella cache sono per utente e non solo per query. Ciò significa che, anziché utilizzare i risultati memorizzati nella cache ogni volta che viene eseguita la stessa query entro il periodo di memorizzazione nella cache, Looker li utilizzerà solo se lo stesso utente ha eseguito la stessa query entro il periodo di memorizzazione nella cache. Per ulteriori informazioni sulla memorizzazione nella cache, consulta la pagina di documentazione Caching queries (Query di memorizzazione nella cache).
  • Le tabelle derivate permanenti (PDT) non sono supportate per le connessioni Trino con OAuth.
  • Quando un amministratore di Looker esegue sudo come un altro utente, utilizza il token di accesso OAuth dell'utente. Se il token di accesso dell'utente è scaduto, l'amministratore non può creare un nuovo token per conto dell'utente con accesso sudo. Per informazioni sull'utilizzo del comando sudo, consulta la pagina della documentazione relativa agli utenti.
  • Quando accedi ad Azure AD da Looker utilizzando OAuth, Looker non mostra una finestra di dialogo per il consenso esplicito dell'utente. Con la configurazione di OAuth con Looker, acconsenti implicitamente all'accesso della tua istanza Looker ai tuoi dati Trino.

Registrazione di un'applicazione

Per attivare OAuth per Trino, registra prima un'applicazione utilizzando un provider di identità supportato. Looker supporta solo Microsoft Entra ID (in precedenza noto come Azure AD) per OAuth con Trino.

Prerequisiti

  • Devi avere un abbonamento Azure.
  • Devi disporre delle autorizzazioni amministrative in Microsoft Entra ID.

Per registrare un'applicazione:

  1. Vai al portale di Azure e accedi con le tue credenziali.
  2. Nella barra di ricerca del portale di Azure, cerca "Microsoft Entra ID" e selezionalo dai risultati.
  3. Nel servizio Microsoft Entra ID, fai clic su Nuova registrazione nella sezione Registrazioni app della categoria Gestisci.
  4. Compila il modulo di registrazione come segue:
    • Nome: fornisci un nome descrittivo per l'applicazione, ad esempio Looker Trino Connection.
    • Tipi di account supportati: seleziona l'opzione appropriata in base a come vuoi limitare l'accesso. Per un caso d'uso interno, puoi selezionare Solo account in questa directory dell'organizzazione.
    • URI di reindirizzamento: seleziona la piattaforma Web, quindi inserisci l'URI di reindirizzamento di Looker. Dovrebbe avere il seguente aspetto: https://YOUR_LOOKER_HOSTNAME/external_oath/redirect.
  5. Fai clic su Registrati.
  6. Raccogliere l'ID client, l'ID tenant e il client secret da inserire in seguito nella connessione di Looker.
    • Puoi trovare l'ID client e l'ID tenant nella pagina Panoramica.
    • Se non conosci il tuo token client, dovrai crearne uno nuovo. Fai clic su Certificati e secret nella sezione Gestisci e poi su Nuovo segreto client.
  7. Fai clic su Esponi un'API nella sezione Gestisci.
  8. Accanto a URI ID applicazione, fai clic su Aggiungi.
  9. Inserisci il tuo ID cliente. Deve essere nel seguente formato: api://CLIENT_ID.

Poi, segui questi passaggi nel portale di Azure per creare un nuovo ambito da utilizzare con Looker:

  1. Fai clic su Aggiungi un ambito nella sezione Ambiti definiti da questa API.
  2. Aggiungi un Nome ambito per il nuovo ambito. Looker si aspetta che il nome dell'ambito sia TrinoUsers.Read.All.

    Il nome TrinoUsers.Read.All implica autorizzazioni di sola lettura, ma il nome stesso non imposta né applica alcuna autorizzazione. Assicurati di configurare l'ambito in modo da consentire solo l'accesso in lettura al database.

  3. Aggiungi un nome visualizzato e una descrizione.

  4. Nel selettore Chi può dare il consenso?, seleziona Amministratori e utenti.

  5. Fai clic su Aggiungi ambito.

  6. Nella sezione Applicazioni client autorizzate, fai clic su Aggiungi un'applicazione client.

  7. Inserisci il tuo ID client e l'ambito appena creato.

  8. Fai clic su Add application (Aggiungi applicazione).

Per concedere a Looker le autorizzazioni API necessarie:

  1. Nella sezione Gestisci, fai clic su Autorizzazioni API.
  2. Fai clic su Aggiungi un'autorizzazione.
  3. Seleziona la scheda Le mie API in alto.
  4. Nell'elenco delle registrazioni delle app, seleziona quella che hai appena creato, ad esempio Looker Trino Connection.
  5. Seleziona la casella di controllo Autorizzazioni delegate.
  6. Seleziona la casella di controllo TrinoUsers.Read.All.
  7. Seleziona Aggiungi autorizzazione.

Configurazione del database per l'utilizzo di OAuth

A questo punto, per configurare il database Trino in modo che utilizzi OAuth, aggiungi le seguenti righe al file config.properties di Trino. Sostituisci le prime cinque righe di variabili in maiuscolo con i tuoi valori.

  • YOUR_HTTPS_PORT
  • PATH_TO_YOUR_SSL_CERTIFICATE
  • YOUR_TENANT_ID
  • YOUR_CLIENT_ID
  • YOUR_SHARED_SECRET
# enable SSL for OAuth
http-server.https.enabled=true
http-server.https.port=YOUR_HTTPS_PORT
http-server.https.keystore.path=PATH_TO_YOUR_SSL_CERTIFICATE

# enable OAuth 2.0
http-server.authentication.type=oauth2
http-server.authentication.oauth2.issuer=https://sts.windows.net/YOUR_TENANT_ID/
http-server.authentication.oauth2.client-id=NA_required_but_not_used
http-server.authentication.oauth2.client-secret=NA_required_but_not_used

# turn off oidc discovery - Trino will inspect tokens locally instead
http-server.authentication.oauth2.oidc.discovery=false

# URLs that Trino requires for OAuth
http-server.authentication.oauth2.jwks-url=https://login.microsoftonline.com/common/discovery/v2.0/keys
http-server.authentication.oauth2.auth-url=NA_required_but_not_used
http-server.authentication.oauth2.token-url=NA_required_but_not_used

# add audience that matches the Azure AD's Application ID URI
http-server.authentication.oauth2.additional-audiences=api://YOUR_CLIENT_ID

# set shared-secret required for internal Trino communication when authentication is enabled, see: https://github.com/trinodb/trino/issues/12397
# can be generated with the following Linux command: openssl rand 512 | base64
internal-communication.shared-secret=YOUR_SHARED_SECRET

# optionally, allow some insecure http traffic
# http-server.authentication.allow-insecure-over-http=true

Accedere per eseguire query

Una volta configurata la connessione al database per l'utilizzo di OAuth, agli utenti verrà chiesto di accedere a Microsoft Entra ID prima di eseguire le query. Sono incluse le query provenienti da esplorazioni, dashboard, Look e SQL Runner.

Gli utenti possono anche accedere a Microsoft Entra ID dalla sezione Credenziali di connessione OAuth nella pagina Account.

Per accedere a Microsoft Entra ID utilizzando Looker:

  1. Fai clic sul menu dell'utente di Looker.
  2. Seleziona Account.
  3. Nella pagina Account, fai clic su Accedi nella sezione Credenziali di connessione OAuth.

Questa azione mostrerà una finestra di dialogo di accesso. Inserisci le credenziali del tuo ID Microsoft Entra e seleziona Accedi per concedere a Looker l'accesso al tuo account database.

Dopo aver eseguito l'accesso a Microsoft Entra ID tramite Looker, puoi uscire o autorizzare nuovamente le tue credenziali in qualsiasi momento tramite la pagina Account, come descritto nella pagina della documentazione Personalizzare il tuo account utente.

Riferimento

Per ulteriori informazioni sulla configurazione del connettore Hive, consulta PrestoDB Hive Connector, Trino Hive Connector o Starburst Hive Connector.

Funzionalità supportate

Affinché Looker supporti alcune funzionalità, anche il dialetto del database deve supportarle.

PrestoDB supporta le seguenti funzionalità a partire da Looker 24.20:

Funzionalità Supportato?
Livello di assistenza
Supportato
Looker (Google Cloud core)
Aggregati simmetrici
Tabelle derivate
Tabelle derivate SQL permanenti
Tabelle derivate native permanenti
Visualizzazioni stabili
Interruzioni delle query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Percentile distinto
No
Processi di visualizzazione di SQL Runner
Tabella Describe di SQL Runner
Indici di SQL Runner Show
No
SQL Runner Select 10
Conteggio di SQL Runner
SQL Explain
Credenziali OAuth
No
Commenti contestuali
Pool di connessioni
No
Schizzi HLL
Aggregate Awareness
PDT incrementali
No
Millisecondi
Microsecondi
No
Viste materializzate
No
Conteggio approssimativo valori distinti

A partire da Looker 24.20, Trino supporta le seguenti funzionalità:

Funzionalità Supportato?
Livello di assistenza
Supportato
Looker (Google Cloud core)
Aggregati simmetrici
Tabelle derivate
Tabelle derivate SQL permanenti
Tabelle derivate native permanenti
Visualizzazioni stabili
No
Interruzioni delle query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Percentile distinto
No
Processi di visualizzazione di SQL Runner
Tabella Describe di SQL Runner
Indici di SQL Runner Show
No
SQL Runner Select 10
Conteggio di SQL Runner
SQL Explain
Credenziali OAuth
Commenti contestuali
Pool di connessioni
No
Schizzi HLL
Aggregate Awareness
PDT incrementali
No
Millisecondi
Microsecondi
No
Viste materializzate
No
Conteggio approssimativo valori distinti

Passaggi successivi

Dopo aver collegato il database a Looker, configura le opzioni di accesso per gli utenti.