Per consentire l'esplorazione dei dati, Looker (Google Cloud core) deve essere connesso a un database. È possibile creare una connessione BigQuery predefinita che può utilizzare le credenziali predefinite dell'applicazione utilizzando la connessione di avvio rapido BigQuery.
Prima di iniziare
La configurazione di una connessione di avvio rapido BigQuery richiede le seguenti autorizzazioni.
Autorizzazioni di Looker (Google Cloud core)
Puoi visualizzare e modificare la pagina Connessione rapida BigQuery nella pagina Home della tua istanza di Looker (Google Cloud core) se disponi di una delle seguenti autorizzazioni:
- Il ruolo Amministratore di Looker (Google Cloud core)
- L'
manage_project_connections
autorizzazione Looker (Google Cloud core)
Autorizzazioni BigQuery
Le istanze di Looker (Google Cloud core) possono utilizzare le credenziali predefinite dell'applicazione (ADC) per l'autenticazione quando configuri una connessione a un database BigQuery Standard SQL. Quando utilizzi l'ADC, la connessione si autentica nel database utilizzando le credenziali dell'account di servizio del progetto Looker (Google Cloud core).
Se l'account di servizio Looker (Google Cloud core) non dispone già di ruoli IAM nel progetto che contiene il set di dati BigQuery, per concedere nuovi ruoli IAM all'agente di servizio devi poter modificare i criteri IAM nella console Google Cloud seguendo i passaggi che seguono.
- Accedi alla console Google Cloud e vai al progetto in cui vuoi concedere nuovi ruoli.
- Copia l'identificatore dell'entità e aggiungilo come entità in IAM.
- Assegna entrambi i seguenti ruoli all'entità che hai aggiunto:
Service Usage Consumer
BigQuery Jobs User
Se la tua istanza di Looker (Google Cloud core) utilizza tabelle derivate permanenti con un set di dati BigQuery, devi concedere all'account di servizio Looker (Google Cloud core) anche il ruolo IAM Editor dati BigQuery.
Configurazione di una connessione guida rapida di BigQuery
La connessione guida rapida di BigQuery contiene le seguenti sezioni.
- Billing Project ID (ID progetto di fatturazione)
- Set di dati principale
- Impostazioni facoltative
- Revisione
Visualizzazione della connessione
La connessione di avvio rapido BigQuery può essere visualizzata e modificata dagli utenti con le autorizzazioni corrette dalla pagina Home o dalla pagina Connessioni nel pannello di amministrazione. Nella pagina Connessioni, la connessione BigQuery Quickstart viene visualizzata con il nome Connessione BigQuery predefinita. In una nuova istanza, i campi ID progetto di archiviazione e ID progetto di fatturazione avranno per impostazione predefinita il valore Nessun.
Nella pagina Home, fai clic sul pulsante Esamina connessione per gestire la connessione. Puoi ignorare il riquadro della pagina Home facendo clic sulla x o attivando/disattivando l'opzione Guida rapida a BigQuery nella barra laterale di Discover.
La connessione guida rapida di BigQuery contiene le seguenti sezioni.
- Billing Project ID (ID progetto di fatturazione)
- Set di dati principale
- Impostazioni facoltative
- Revisione
ID progetto di fatturazione
L'ID progetto funge da identificatore univoco per il progetto di fatturazione Google Cloud . Il progetto di fatturazione è il progetto Google Cloud a cui viene addebitato il costo, ma puoi comunque eseguire query sui set di dati in un altro progetto Google Cloud se gli sviluppatori LookML specificano nomi di tabelle con ambito completo nel parametro sql_table_name delle visualizzazioni, delle esplorazioni o dei join di LookML. Questo campo è obbligatorio.
Per autenticarti in un database BigQuery utilizzando OAuth: per le connessioni BigQuery, Looker (Google Cloud core) può utilizzare automaticamente le credenziali dell'applicazione OAuth che l'amministratore di Looker (Google Cloud core) ha utilizzato per creare l'istanza. Per ulteriori informazioni, consulta la pagina Crea credenziali di autorizzazione OAuth per un'istanza di Looker (Google Cloud core).
Espandi la sezione Dettagli stato per testare le impostazioni della connessione.
Set di dati principale
La pagina Set di dati principale contiene le seguenti impostazioni.
ID progetto di archiviazione
Se utilizzi un progetto diverso dal progetto BigQuery in cui si trova Looker (Google Cloud core), inserisci l'ID progetto di archiviazione. Questo campo è obbligatorio.
Per trovare l'ID progetto di archiviazione:
- Apri la console Google Cloud .
- Dall'elenco dei progetti, seleziona Tutti. Vengono visualizzati i nomi e gli ID di tutti i progetti di cui sei membro.
- Copia l'ID progetto di archiviazione del progetto contenente i dati che vuoi collegare a Looker (Google Cloud core).
Set di dati principale
Il set di dati principale è il luogo in cui BigQuery cercherà le tabelle se la loro posizione non è specificata nel testo della query SQL. Tieni presente che le query di Looker (Google Cloud core) possono fare riferimento a tabelle in qualsiasi progetto o set di dati, a condizione che le query utilizzino nomi di tabelle con ambito completo nel formato project_id.dataset_name.table_name
. L'agente di servizio Looker (Google Cloud core) avrà inoltre bisogno delle autorizzazioni IAM appropriate per accedere alle tabelle in quella posizione. Questo campo è obbligatorio.
Per scoprire di più sui set di dati, consulta la pagina della documentazione Connessione di Looker a BigQuery.
Espandi la sezione Dettagli stato per testare le impostazioni della connessione.
Impostazioni facoltative
La sezione Impostazioni facoltative contiene le seguenti opzioni:
Numero massimo di connessioni per nodo: il numero massimo di connessioni al database consentite contemporaneamente. Nota: questa impostazione è valida per ogni nodo nel deployment di Looker (Google Cloud core). Il valore deve essere compreso tra 5 e 100 e può essere lasciato inizialmente al valore predefinito. Scopri di più su questa impostazione nella sezione Numero massimo di connessioni per nodo della pagina della documentazione Connessione di Looker al database.
Timeout del pool di connessioni: il numero di secondi che una query attende prima del timeout quando il pool di connessioni è completo. All'inizio può essere lasciato al valore predefinito. Scopri di più su questa impostazione nella sezione Timeout del pool di connessioni della pagina della documentazione Connessione di Looker al database.
Parametri JDBC aggiuntivi: aggiungi eventuali parametri JDBC aggiuntivi, ad esempio le etichette BigQuery (per ulteriori informazioni, consulta la sezione Etichette dei job e commenti contestuali per le connessioni BigQuery in questa pagina).
Pianificazione della manutenzione: espressione cron che indica la frequenza massima dei controlli degli attivatori dei gruppi di dati e della manutenzione di PDT. Scopri di più su questa impostazione nella documentazione relativa alla pianificazione della manutenzione di PDT e gruppi di dati.
SSL: scegli se utilizzare la crittografia SSL per proteggere i dati scambiati tra Looker (Google Cloud core) e il tuo database. SSL è solo una delle opzioni disponibili per proteggere i tuoi dati. Le altre opzioni di sicurezza sono illustrate nella pagina della documentazione che illustra come abilitare l'accesso sicuro ai database.
Verifica SSL: scegli se rendere obbligatoria la verifica del certificato SSL utilizzato dalla connessione. Scopri di più su questa impostazione nella sezione Verifica SSL della pagina della documentazione Connessione di Looker al database.
Prememorizza tabelle e colonne nella cache: in SQL Runner, tutte le informazioni relative alle tabelle vengono precaricate appena selezioni una connessione e uno schema. Questo permette a SQL Runner di visualizzare rapidamente le colonne di una tabella appena fai clic sul suo nome. Tuttavia, per le connessioni e gli schemi associati a tabelle numerose o molto grandi non è consigliabile precaricare tutte le informazioni richieste da SQL Runner.
Recupero e memorizzazione nella cache dello schema: per alcune funzionalità di scrittura SQL, come il rilevamento degli aggregati, Looker (Google Cloud core) utilizza lo schema di informazioni del database per ottimizzare la scrittura SQL. Scopri di più su questa impostazione nella sezione Recupero schema informazioni per scrittura SQL della pagina della documentazione Connessione di Looker al database.
Attiva PDT: attiva l'opzione Attiva PDT per attivare le tabelle derivate permanenti. Quando i PDT sono attivati, la finestra Impostazioni facoltative mostra ulteriori campi PDT e la sezione Override PDT.
Database temporaneo: inserisci il set di dati in BigQuery, dove Looker (Google Cloud core) creerà tabelle derivate permanenti. Questo set di dati deve essere configurato preventivamente, con le autorizzazioni di scrittura appropriate. Questo campo è obbligatorio per utilizzare i PDT.
Numero massimo di connessioni del builder di PDT: il valore predefinito dell'impostazione Numero massimo di connessioni del builder di PDT è 1, ma è possibile impostare un valore fino a 10. Tuttavia, il valore non può essere superiore a quello impostato in Connessioni massime per nodo. Scopri di più su questa impostazione nella sezione Numero massimo di connessioni del builder di PDT della pagina della documentazione Connessione di Looker al database. Imposta questo valore con attenzione. Un valore troppo elevato può sovraccaricare il database. Se il valore è troppo basso, le PDT a esecuzione prolungata o le tabelle aggregate possono ritardare la creazione di altre tabelle permanenti o rallentare le altre query sulla connessione.
Riprova le ricostruzioni PDT non riuscite: l'opzione di attivazione/disattivazione Riprova le ricostruzioni PDT non riuscite configura il modo in cui il rigeneratore Looker (Google Cloud core) tenta di ricostruire le tabelle rese permanenti da trigger che non sono riuscite durante il ciclo precedente del rigeneratore. Scopri di più su questa impostazione nella sezione Riprova le operazioni di creazione di PDT non riuscite della pagina della documentazione Connessione di Looker al database.
Controllo dell'API PDT: l'opzione di attivazione/disattivazione Controllo dell'API PDT determina se è possibile utilizzare le chiamate API
start_pdt_build
,check_pdt_build
estop_pdt_build
per questa connessione. Quando l'opzione di attivazione/disattivazione Controllo dell'API PDT è disattivata, queste chiamate all'API non andranno a buon fine quando fanno riferimento ai PDT su questa connessione.Sostituzioni PDT: se il tuo database supporta le tabelle derivate permanenti e hai attivato l'opzione di attivazione/disattivazione Attiva PDT nelle impostazioni di connessione, Looker (Google Cloud core) mostra la sezione Sostituzioni PDT. Nella sezione Sostituzioni PDT, puoi inserire parametri JDBC separati (host, porta, database, nome utente, password, schema, parametri aggiuntivi e istruzioni after connect) specifici per i processi PDT. Scopri di più su questa impostazione nella sezione Sostituzioni PDT della pagina della documentazione Connessione di Looker al database.
Fuso orario del database: il fuso orario in cui il database archivia le informazioni basate sul tempo. Looker (Google Cloud core) deve conoscere queste impostazioni per poter convertire i valori di data/ora per gli utenti, semplificando la comprensione e l'utilizzo dei dati basati sul tempo. Per ulteriori informazioni, consulta la pagina della documentazione dedicata all'utilizzo delle impostazioni relative al fuso orario.
Fuso orario query: l'opzione Fuso orario query è visibile solo se hai disattivato Fusi orari specifici degli utenti. Per ulteriori informazioni, consulta la pagina della documentazione dedicata all'utilizzo delle impostazioni relative al fuso orario.
Espandi la sezione Dettagli stato per testare le impostazioni della connessione.
Rivedi
Esamina e modifica i dettagli di connessione inseriti nelle sezioni precedenti nella sezione Rivedi.
Espandi la sezione Dettagli stato per testare le impostazioni della connessione. Fai clic sull'icona di modifica accanto a ogni sezione per tornare a quella sezione e modificare le impostazioni.
Salvataggio e verifica della connessione
Fai clic sul pulsante Salva per salvare le modifiche apportate alla connessione di avvio rapido di BigQuery.
Puoi testare le impostazioni di connessione in due punti dell'interfaccia utente di Looker (Google Cloud core):
- Espandi la sezione Dettagli stato nella parte inferiore di una delle pagine di connessione della configurazione guidata e fai clic su Testa connessione.
- Nella pagina Home, espandi la sezione Dettagli stato nella parte inferiore del riquadro Connessione QuickStart e fai clic su Prova connessione.
- Nella pagina Amministrazione Connessioni, seleziona il pulsante Test accanto alla voce della connessione, come descritto nella pagina della documentazione Connessioni.
Dopo aver inserito le impostazioni di connessione, fai clic su Test per verificare che le informazioni siano corrette e che sia possibile stabilire la connessione al database.
Se la connessione non supera uno o più test, ecco alcune opzioni per la risoluzione dei problemi:
- Prova alcuni dei passaggi per la risoluzione dei problemi illustrati nella pagina della documentazione dedicata ai test di connettività del database.
- Accedi ai log della tua istanza di Looker (Google Cloud core) per visualizzare messaggi di errore più dettagliati.
- Contatta l'assistenza per ulteriore assistenza per la risoluzione dei problemi.
Passaggi successivi
- Gestire gli utenti in Looker (Google Cloud core)
- Amministra un'istanza di Looker (Google Cloud core) dalla console Google Cloud
- Impostazioni di amministrazione di Looker (Google Cloud core)
- Utilizza il progetto LookML di esempio su un'istanza di Looker (Google Cloud core)