Google BigQuery

Panoramica

Questa pagina spiega come configurare una connessione in Looker a Google BigQuery Standard SQL o a Google BigQuery Legacy SQL.

I passaggi generali per configurare una connessione Google BigQuery Standard SQL o Google BigQuery Legacy SQL sono i seguenti:

  1. Nel database BigQuery, configura l'autenticazione che verrà utilizzata da Looker per accedere al database. Looker supporta le seguenti opzioni di autenticazione per BigQuery:

  2. Nel database BigQuery, se vuoi utilizzare tabelle derivate permanenti (PDT) nella connessione, crea un set di dati temporaneo che Looker possa utilizzare per creare PDT nel database. Per la procedura, consulta la sezione Creare un set di dati temporaneo per le tabelle derivate permanenti in questa pagina.

  3. In Looker, configura la connessione di Looker al tuo database BigQuery. Per la procedura, consulta la sezione Collegare Looker a BigQuery in questa pagina.

  4. In Looker, testa la connessione tra Looker e il tuo database BigQuery. Per la procedura, consulta la sezione Testare la connessione in questa pagina.

Crittografia del traffico di rete

È buona prassi criptare il traffico di rete tra l'applicazione Looker e il database. Valuta la possibilità di utilizzare una delle opzioni descritte nella pagina della documentazione Abilitare l'accesso sicuro ai database.

Autenticazione con gli account di servizio BigQuery

Un modo in cui Looker può autenticarsi nel tuo database BigQuery è con un account di servizio BigQuery. Crea l'account di servizio nel database BigQuery utilizzando API Manager nella console Google Cloud . Per creare il account di servizio, devi disporre delle autorizzazioni di amministratore di Google Cloud . Consulta la documentazione sulla creazione di un account di servizio e sulla generazione di una chiave privata.

Creare un account di servizio e scaricare il certificato delle credenziali JSON

Per creare un account di servizio BigQuery:

  1. Apri la pagina delle credenziali in API Manager nella console e seleziona il tuo progetto.

  2. Seleziona CREA CREDENZIALI e scegli Account di servizio.

  3. Inserisci un nome per il nuovo account di servizio, aggiungi facoltativamente una descrizione e seleziona CREA E CONTINUA.

  4. Il tuo account di servizio richiede due ruoli predefiniti di Google BigQuery:

    • BigQuery > BigQuery Data Editor
    • BigQuery > Utente job BigQuery

    Seleziona il primo ruolo nel campo Seleziona un ruolo, seleziona AGGIUNGI UN ALTRO RUOLO e poi seleziona il secondo ruolo.

    Dopo aver selezionato entrambi i ruoli, seleziona CONTINUA e poi FINE.

  5. Nella pagina Credenziali, seleziona il nuovo account di servizio:

  6. Seleziona CHIAVI, poi AGGIUNGI CHIAVE e, nel menu a discesa, seleziona Crea nuova chiave:

  7. Seleziona JSON in Tipo di chiave e poi CREA:

  8. La chiave JSON verrà salvata sul computer.

    Dopo aver preso nota della posizione di download, seleziona CHIUDI:

  9. Seleziona FINE.

  10. Trova l'indirizzo email corrispondente all'account di servizio. Ti servirà questo indirizzo per configurare la connessione di Looker a BigQuery:

  11. Dopo aver creato l'account di servizio nel database BigQuery, dovrai inserire i relativi dati e i dettagli del file del certificato nei campi Indirizzo email account di servizio, File JSON/P12 account di servizio e Password della finestra Connessioni di Looker quando configuri la connessione di Looker a BigQuery.

Autenticazione con OAuth

Looker supporta OAuth per le connessioni a Google BigQuery, il che significa che ogni utente di Looker si autentica su Google con le proprie credenziali OAuth di Google e autorizza Looker ad accedere al database.

OAuth consente agli amministratori del database di eseguire le seguenti funzioni:

  • Controlla quali utenti di Looker stanno eseguendo query sul database.
  • Applica i controlli di accesso basati sui ruoli utilizzando le autorizzazioni Google.
  • Utilizza i token OAuth per tutte le procedure e le azioni che accedono a Google BigQuery, anziché incorporare ID e password di BigQuery in più posizioni.

Tieni presente quanto segue per le connessioni BigQuery con OAuth:

  • Se un amministratore del database modifica le credenziali del client OAuth di BigQuery, tutte le pianificazioni o gli avvisi di proprietà di un utente saranno interessati. Gli utenti devono accedere di nuovo se l'amministratore modifica le credenziali OAuth di BigQuery. Per accedere a Google, gli utenti possono anche andare alla pagina Account di Looker dalla pagina dell'account del profilo utente.
  • Poiché le connessioni BigQuery che utilizzano OAuth sono "per utente", anche i criteri di memorizzazione nella cache sono per utente e non solo per query. Ciò significa che, anziché utilizzare i risultati memorizzati nella cache ogni volta che viene eseguita la stessa query entro il periodo di memorizzazione nella cache, Looker li utilizzerà solo se lo stesso utente ha eseguito la stessa query entro il periodo di memorizzazione nella cache. Per ulteriori informazioni sulla memorizzazione nella cache, consulta la pagina di documentazione Caching queries (Query di memorizzazione nella cache).
  • Se vuoi utilizzare le tabelle derivate permanenti (PDT) in una connessione BigQuery con OAuth, devi creare un account di servizio aggiuntivo per consentire a Looker di accedere al tuo database per le procedure PDT. Per informazioni, consulta la sezione Tabelle derivate permanenti in una connessione BigQuery in questa pagina.
  • Quando gli amministratori eseguono sudo come un altro utente, utilizzano il token di autorizzazione OAuth dell'utente. Per informazioni sull'utilizzo del comando sudo, consulta la pagina della documentazione relativa agli utenti.

Configurazione di un progetto di database BigQuery per OAuth

Le sezioni seguenti descrivono come generare le credenziali OAuth e come configurare una schermata per il consenso OAuth.

Nei seguenti casi, non è necessario eseguire queste procedure:

Le credenziali OAuth e la schermata per il consenso OAuth devono essere configurate nella console . La descrizione generica di Google è disponibile sul sito di assistenza Google Cloud e sul sito della console per sviluppatori Google.

A seconda del tipo di utenti che accedono ai dati di BigQuery in Looker e se i dati di BigQuery sono pubblici o privati, OAuth potrebbe non essere il metodo di autenticazione più appropriato. Analogamente, il tipo di dati richiesti all'utente e il livello di accesso necessario ai dati dell'utente quando si autentica su Google per utilizzare Looker potrebbero richiedere la verifica da parte di Google. Scopri di più sulla verifica nella sezione Generare le credenziali OAuth di Google di questa pagina.

Generazione delle credenziali OAuth di Google

  1. Vai alla console Google Cloud .

  2. Nel menu a discesa Seleziona un progetto, vai al tuo progetto BigQuery. Dovresti visualizzare la dashboard del progetto.

  3. Nel menu a sinistra, seleziona la pagina API e servizi. Quindi seleziona Credenziali. Nella pagina Credenziali, seleziona la Freccia giù nel pulsante Crea credenziali e seleziona ID client OAuth dal menu a discesa:

  4. Google richiede di configurare una schermata per il consenso OAuth, che consente agli utenti di scegliere come concedere l'accesso ai propri dati privati, prima che tu possa generare le credenziali OAuth. Per configurare la schermata per il consenso OAuth, consulta la sezione Configurare una schermata per il consenso OAuth in questa pagina.

  5. Se hai già configurato una schermata di consenso OAuth, Google mostra la pagina Crea ID client OAuth, che ti consente di creare un ID client OAuth e un segreto da utilizzare nella connessione BigQuery a Looker. Dal menu a discesa Tipo di applicazione, seleziona Applicazione web. La pagina si espande e mostra opzioni aggiuntive:

  6. Nel campo Nome, inserisci un nome per l'app, ad esempio Looker.

  7. Nella sezione Origini JavaScript autorizzate, seleziona + AGGIUNGI URI per visualizzare il campo URI 1. Nel campo URI 1, inserisci l'URL dell'istanza di Looker, incluso https://. Ad esempio:

    • Se la tua istanza è ospitata da Looker: https://<instancename>.looker.com
    • Se hai un'istanza di Looker ospitata dal cliente: https://looker.<mycompany>.com
    • Se la tua istanza Looker richiede un numero di porta: https://looker.<mycompany>.com:9999
  8. Nella sezione URI di reindirizzamento autorizzati, seleziona + AGGIUNGI URI per visualizzare il campo URI 1. Nel campo URI 1, inserisci l'URL dell'istanza Looker, seguito da /external_oauth/redirect. Ad esempio: https://<instancename>.looker.com/external_oauth/redirect o https://looker.<mycompany>.com:9999/external_oauth/redirect.

  9. Seleziona Crea. Google mostra il tuo ID client e il tuo client secret.

  10. Copia i valori dell'ID client e del client secret. Ti serviranno per configurare OAuth per la connessione a BigQuery in Looker.

Google richiede di configurare una schermata per il consenso OAuth, che consente agli utenti di scegliere come concedere l'accesso ai propri dati privati e fornisce un link ai Termini di servizio e alle Norme sulla privacy della tua organizzazione.

Nel menu a sinistra, seleziona la pagina Schermata del consenso OAuth. Prima di poter configurare la schermata del consenso OAuth, devi scegliere il tipo di utenti a cui rendere disponibile l'app. A seconda della tua selezione, la tua app potrebbe richiedere la verifica da parte di Google.

Effettua la selezione e seleziona Crea. Google mostra la pagina della schermata per il consenso OAuth. Puoi configurare questa schermata per tutte le applicazioni del progetto, incluse quelle interne e pubbliche.

Google eseguirà una verifica per le applicazioni pubbliche se una delle seguenti condizioni è vera:

  • L'applicazione utilizza API di Google che utilizzano ambiti sensibili o con limitazioni.
  • La schermata per il consenso OAuth include un logo dell'applicazione.
  • Il progetto ha superato la soglia del dominio.

Per configurare la schermata per il consenso OAuth:

  1. Nel campo Nome app, inserisci il nome dell'applicazione a cui l'utente concede l'accesso, in questo caso Looker.

  2. Nel campo Indirizzo email dell'assistenza utente, inserisci l'indirizzo email dell'assistenza che gli utenti devono contattare in caso di problemi di accesso o di consenso.

  3. Seleziona AGGIUNGI DOMINIO per visualizzare il campo Dominio autorizzato 1. In questo campo, inserisci il dominio dell'URL dell'istanza di Looker. Ad esempio, se Looker ospita la tua istanza all'indirizzo https://<instance_name>.cloud.looker.com, il dominio è cloud.looker.com. Per i deployment di Looker ospitati dal cliente, inserisci il dominio su cui ospiti Looker.

  4. Nella sezione Dati di contatto dello sviluppatore, inserisci uno o più indirizzi email che Google può utilizzare per contattarti in merito al tuo progetto.

    I campi rimanenti sono facoltativi, ma puoi utilizzarli per personalizzare ulteriormente la schermata del consenso.

  5. Seleziona SALVA E CONTINUA.

  6. Google mostra la pagina Ampi dello spettro, in cui puoi configurare gli ampi dello spettro. Looker richiede solo gli ambiti predefiniti, pertanto non è necessaria alcuna configurazione aggiuntiva. Seleziona SALVA E CONTINUA.

  7. Nella pagina Riepilogo, seleziona TORNA ALLA DASHBOARD.

Ora puoi continuare la procedura per la generazione delle credenziali OAuth.

Per ulteriori informazioni sulla configurazione della schermata per il consenso OAuth di Google, consulta la documentazione dell'assistenza di Google.

Configurazione della connessione di Looker per BigQuery con OAuth

Per attivare OAuth per la connessione a BigQuery, seleziona l'opzione OAuth nella pagina Connessione di Looker quando configuri la connessione di Looker a BigQuery. Quando selezioni l'opzione OAuth, Looker mostra i campi ID client OAuth e Client secret OAuth. Incolla i valori ID client e Client secret che hai ottenuto come passaggio della procedura di generazione delle credenziali OAuth di Google in questa pagina.

Se hai impostato una durata della sessione per OAuth di BigQuery, per evitare i timeout della sessione di Looker dovrai utilizzare la funzionalità App attendibili esenti per aggiungere Looker alle tue app attendibili. Consulta l'articolo del Centro assistenza sull'impostazione della durata della sessione per i servizi Google Cloud per visualizzare i passaggi di questa procedura.

Come gli utenti di Looker si autenticano in BigQuery con OAuth

Una volta configurata la connessione di Looker a BigQuery per OAuth, gli utenti possono utilizzare Looker per eseguire l'autenticazione iniziale nel database BigQuery in uno dei seguenti modi:

Autenticazione in Google da una query

Una volta configurata la connessione di Looker a BigQuery per OAuth, Looker chiederà agli utenti di accedere con il proprio Account Google prima di eseguire query che utilizzano la connessione BigQuery. Looker mostra questo prompt da esplorazioni, dashboard, Look e SQL Runner.

L'utente deve selezionare Accedi e autenticarsi con OAuth. Dopo aver eseguito l'autenticazione in BigQuery, l'utente può selezionare il pulsante Esegui nell'esplorazione e Looker caricherà i dati nell'esplorazione.

Autenticazione su Google dalla pagina dell'account utente

Una volta configurata la connessione di Looker a BigQuery per OAuth, un utente può autenticarsi nel proprio Account Google dalla pagina dell'account utente di Looker:

  1. In Looker, seleziona l'icona del profilo e seleziona Account dal menu utente.
  2. Vai alla sezione Credenziali di connessione OAuth e seleziona il pulsante Accedi per la connessione al database BigQuery appropriata.
  3. Seleziona l'account appropriato dalla pagina Accedi con Google.
  4. Seleziona Consenti nella schermata del consenso OAuth per consentire a Looker di visualizzare e gestire i tuoi dati in Google BigQuery.

Dopo aver eseguito l'autenticazione in Google tramite Looker, puoi uscire o autorizzare nuovamente le tue credenziali in qualsiasi momento dalla pagina Account, come descritto nella pagina della documentazione Personalizzare l'account utente. Sebbene i token Google BigQuery non scadano, un utente può selezionare Autorizza di nuovo per accedere con un altro Account Google.

Revocare i token OAuth

Gli utenti possono revocare l'accesso da applicazioni come Looker all'Account Google visitando le impostazioni dell'Account Google.

I token Google BigQuery non scadono; tuttavia, se un amministratore del database modifica le credenziali OAuth della connessione al database in modo da invalidare le credenziali esistenti, gli utenti dovranno accedere di nuovo con il proprio Account Google prima di eseguire query che utilizzano la connessione.

Tabelle derivate permanenti in una connessione BigQuery

Se vuoi utilizzare le tabelle derivate persistenti (PDT) per la connessione a BigQuery, a seconda della configurazione della connessione, potresti dover eseguire le seguenti operazioni:

  • Utilizza la console Google Cloud per creare un set di dati temporaneo nel database BigQuery che Looker può utilizzare per scrivere i PDT. Per la procedura, consulta la sezione Creare un set di dati temporaneo per le tabelle derivate permanenti in questa pagina. Questo passaggio è obbligatorio per i PDT, indipendentemente dalle altre opzioni di configurazione della connessione.
  • Utilizza API Manager nella console Google Cloud per creare un account di servizio separato per i processi PDT di Looker. Per la procedura, consulta la sezione Creare un account di servizio e scaricare il certificato delle credenziali JSON in questa pagina. Il tipo di autenticazione della connessione influisce sulla necessità di un account di servizio PDT e anche su dove inserire i dati dell'account di servizio PDT nella finestra Connessioni di Looker quando configuri la connessione di Looker a BigQuery:
    • Se la connessione utilizza OAuth per l'autenticazione utente, devi creare un account di servizio separato per i processi PDT. Dovrai inserire i dati dell'account di servizio e i dettagli del file del certificato nella sezione Sostituzioni PDT della finestra Connessioni di Looker. La finestra Connessioni di Looker mostra automaticamente la sezione Sostituzioni PDT quando attivi l'opzione di attivazione/disattivazione Attiva PDT per una connessione configurata anche con l'opzione OAuth nel campo Autenticazione. Per ulteriori informazioni, consulta la sezione Abilitazione dei token di accesso a livello di progetto per le connessioni di Looker a BigQuery con OAuth.
    • Se la connessione utilizza account di servizio per l'autenticazione utente, puoi creare un account di servizio separato per i processi PDT. Se scegli di avere un account di servizio PDT separato, dovrai inserire i dati dell'account di servizio nella sezione Sostituzioni PDT per i campi Email account di servizio, File JSON/P12 account di servizio e Password della finestra Connessioni di Looker. La sezione Sostituzioni PDT viene visualizzata quando attivi l'opzione di attivazione/disattivazione Attiva i PDT per una connessione di Looker a BigQuery che utilizza l'autenticazione dell'account di servizio.

Creazione di un set di dati temporaneo per le tabelle derivate permanenti

Per attivare le tabelle derivate permanenti (PDT) per la connessione a BigQuery, attiva l'opzione Attiva PDT nella pagina Connessione di Looker quando configuri la connessione di Looker a BigQuery. Quando attivi le PDT, Looker mostra il campo Set di dati temp. In questo campo, inserisci il nome del set di dati che Looker può utilizzare per creare i PDT. Il database o lo schema deve essere configurato preventivamente, con le autorizzazioni di scrittura adeguate.

Puoi configurare un set di dati temporaneo utilizzando la console Google Cloud :

  1. Apri la console e seleziona il tuo progetto.

  2. Seleziona il menu con tre puntini e poi Crea set di dati.

  3. Inserisci un ID set di dati (in genere looker_scratch), quindi seleziona la Posizione dei dati (facoltativa), la Scadenza tabella predefinita e la soluzione di gestione delle chiavi di crittografia. Seleziona CREA SET DI DATI per terminare.

Ora che hai creato il set di dati, puoi specificarne il nome nel campo Set di dati temporaneo della finestra Connessioni di Looker quando configuri la connessione di Looker a BigQuery.

Attivazione dei token di accesso a livello di piattaforma per le connessioni di Looker a BigQuery con OAuth

Per le connessioni BigQuery che utilizzano OAuth, gli utenti si autenticano in Looker con le proprie credenziali OAuth. Looker supporta le PDT per le connessioni BigQuery con OAuth, ma Looker stesso non può utilizzare OAuth, quindi devi configurare un account di servizio BigQuery appositamente per consentire a Looker di accedere al tuo database per le procedure PDT.

Puoi configurare un account di servizio PDT nel tuo database BigQuery utilizzando API Manager di Google Cloud . Consulta la sezione Creare un account di servizio e scaricare il certificato delle credenziali JSON in questa pagina.

Dopo aver creato l'account di servizio nel database BigQuery, dovrai inserire i dati dell'account di servizio e i dettagli del file del certificato nella sezione Sostituzioni PDT della finestra Connessioni di Looker quando configuri la connessione di Looker a BigQuery. La finestra Connessioni di Looker mostra automaticamente la sezione Sostituzioni PDT quando attivi l'opzione di attivazione/disattivazione Attiva PDT per una connessione configurata anche con l'opzione OAuth nel campo Autenticazione. Utilizza i seguenti campi nella sezione Sostituzioni PDT per inserire le informazioni relative all'account di servizio che Looker può utilizzare per i processi PDT nel tuo database:

  • Carica file p12 o json: utilizza il pulsante Carica file per caricare il file del certificato per l'account di servizio BigQuery che vuoi utilizzare per le procedure PDT nella connessione. Puoi ottenere questo file da Google Cloud API Manager come passaggio della procedura di creazione di un account di servizio e download del certificato delle credenziali JSON.
  • Nome utente: questo campo si applica solo se carichi un file P12 nel campo Carica p12 o json della sezione Override PDT. Inserisci l'indirizzo email dell'account di servizio BigQuery che vuoi utilizzare per i processi PDT nella connessione. Puoi recuperare questo indirizzo email dall'API Manager di Google Cloud come passaggio della procedura di creazione di un account di servizio e download del certificato delle credenziali JSON.
  • Password: questo campo si applica solo se carichi un file P12 nel campo Carica p12 o json della sezione Sostituzioni PDT. Inserisci la password del file delle credenziali .p12 per l'account di servizio BigQuery che vuoi utilizzare per le procedure PDT nella connessione.

Collegamento di Looker a BigQuery

Nella sezione Amministrazione di Looker, seleziona Connessioni per aprire la pagina Connessioni, quindi esegui una delle seguenti operazioni:

  • Per creare una nuova connessione, seleziona il pulsante Aggiungi connessione.
  • Per modificare una connessione esistente, individuala nella tabella Database e poi seleziona il pulsante Modifica nella voce della connessione.

Compila i dettagli della connessione. La maggior parte di queste impostazioni è comune alla maggior parte dei dialetti di database e sono descritte nella pagina della documentazione Connessione di Looker al tuo database. Le seguenti impostazioni vengono menzionate per metterle in evidenza o per chiarire come si applicano specificamente alle connessioni BigQuery:

  • Dialetto: seleziona SQL standard di Google BigQuery o SQL precedente di Google BigQuery.

  • ID progetto di fatturazione: l'ID progetto (identificatore univoco) del progetto di fatturazione Google Cloud . Il progetto di fatturazione è il progetto Google Cloud a cui vengono addebitati i costi, ma puoi comunque eseguire query sui set di dati in un altro progetto Google Cloud se gli sviluppatori LookML specificano nomi di tabelle con ambito completo nel parametro sql_table_name delle visualizzazioni, delle esplorazioni o delle unioni di LookML. Per BigQuery, un nome di tabella completo utilizza il formato <project_name>.<dataset_name>.<table_name>. Senza un riferimento completo, BigQuery cerca la tabella nel progetto di fatturazione e nel set di dati specificati nella pagina Connessioni di Looker per la connessione BigQuery a Looker. Per una spiegazione della gerarchia delle risorse in BigQuery, consulta la documentazione di BigQuery.

  • ID progetto di archiviazione: il nome dell'ID progetto di archiviazione, se separi le risorse di elaborazione da quelle di archiviazione in un progetto distinto. Puoi eseguire query sui set di dati in un altro progetto Google Cloud se gli sviluppatori di LookML specificano nomi di tabelle con ambito completo nel parametro sql_table_name delle visualizzazioni, delle esplorazioni o dei join di LookML. Per BigQuery, un nome di tabella completo utilizza il formato <project_name>.<dataset_name>.<table_name>. Senza un riferimento completo, BigQuery cerca la tabella nel progetto di fatturazione e nel set di dati specificati nella pagina Connessioni di Looker per la connessione BigQuery a Looker. Per una spiegazione della gerarchia delle risorse in BigQuery, consulta la documentazione di BigQuery.

  • Set di dati: il nome del set di dati che vuoi che venga utilizzato per impostazione predefinita da Looker quando esegue query sul tuo database. Il set di dati predefinito deve trovarsi nel progetto di fatturazione specificato per la connessione. Non puoi inserire un valore come project_name.dataset_name nel campo Database per specificare un set di dati in un altro progetto.

    Il progetto LookML può accedere alle tabelle di altri set di dati (incluse le tabelle dei set di dati pubblici) se gli sviluppatori di LookML specificano nomi di tabelle con ambito completo nel parametro sql_table_name delle viste, delle esplorazioni o delle unioni di LookML. Per BigQuery, un nome di tabella completo utilizza il formato <project_name>.<dataset_name>.<table_name>. Per eseguire query su una tabella in un altro set di dati, la tabella deve essere accessibile dall'account di servizio (per le connessioni che utilizzano l'autenticazione dell'account di servizio) o dall'utente che esegue la query (per le connessioni che utilizzano l'autenticazione OAuth). Se il codice LookML non specifica nomi di tabelle con ambito completo, BigQuery cercherà la tabella nel set di dati specificato nel campo Set di dati della connessione BigQuery.

    Se il tuo progetto non contiene set di dati (il che può accadere se separi l'elaborazione e lo spazio di archiviazione in progetti distinti), puoi fornire un valore Dataset arbitrario, ma devi sempre utilizzare nomi di tabelle con ambito completo in LookML.

  • Autenticazione: il tipo di autenticazione che verrà utilizzato da Looker per accedere al tuo database. Alcune di queste opzioni sono supportate solo per le istanze Looker (Google Cloud core):

  • Attiva PDT: attiva questo pulsante di attivazione/disattivazione per consentire le tabelle derivate permanenti (PDT) nella connessione. Dovrai specificare il set di dati temporaneo nel tuo database che verrà utilizzato da Looker per scrivere i report PDT. Per la procedura, consulta la sezione Creare un set di dati temporaneo per le tabelle derivate permanenti in questa pagina. Nota: se la connessione è configurata per OAuth, dovrai utilizzare la sezione Sostituzioni PDT per specificare un account di servizio che Looker può utilizzare per i processi PDT nella connessione BigQuery. Per maggiori dettagli, consulta la sezione Abilitare i token di accesso a livello di progetto per le connessioni di Looker a BigQuery con OAuth.

  • Set di dati temporaneo: il set di dati BigQuery che hai creato nella console Google Cloud per consentire a Looker di scrivere tabelle derivate permanenti nel tuo database. Per la procedura, consulta la sezione Creare un set di dati temporaneo per le tabelle derivate permanenti.

  • Fuso orario del database: il fuso orario predefinito per BigQuery è UTC. L'impostazione del fuso orario specificata qui deve corrispondere a quella di BigQuery. Per ulteriori informazioni, consulta la sezione Fuso orario del database della pagina Connessione di Looker al database.

  • Fuso orario delle query: per ulteriori informazioni, consulta la sezione Fuso orario delle query della pagina Connessione di Looker al tuo database.

  • Parametri JDBC aggiuntivi: aggiungi eventuali parametri JDBC aggiuntivi, ad esempio le etichette BigQuery (per ulteriori informazioni, consulta la sezione Etichette dei job e commenti contestuali per le connessioni BigQuery in questa pagina). Ecco alcuni altri parametri supportati:

    • connectTimeout: numero di millisecondi da attendere per una connessione. Il valore predefinito è 240000.
    • readTimeout: numero di millisecondi da attendere per una lettura. Il valore predefinito è 240000.
    • rootUrl: se hai un'istanza BigQuery in una rete privata, specifica un endpoint alternativo per connetterti a BigQuery diverso dall'endpoint pubblico predefinito.
  • Gigabyte di fatturazione massima: per le connessioni BigQuery, ti viene addebitato un importo per ogni query in base alle sue dimensioni. Per evitare che gli utenti eseguano accidentalmente una query troppo costosa, puoi impostare un numero massimo di gigabyte che un utente può estrarre in una singola query. Puoi lasciare vuoto il campo Numero massimo di gigabyte di fatturazione se non limiti le dimensioni delle query. Scopri di più sui prezzi nella pagina dei prezzi di BigQuery.

  • Connessioni massime per nodo: inizialmente può essere lasciato il valore predefinito. Scopri di più su questa impostazione nella sezione Numero massimo di connessioni per nodo della pagina della documentazione Connessione di Looker al database.

  • Timeout del pool di connessioni: inizialmente può essere lasciato al valore predefinito. Scopri di più su questa impostazione nella sezione Timeout del pool di connessioni della pagina della documentazione Connessione di Looker al database.

  • Disattiva contesto: questa opzione disattiva i commenti relativi al contesto in una connessione BigQuery. I commenti relativi al contesto nelle connessioni a Google BigQuery sono disattivati per impostazione predefinita perché impediscono a Google BigQuery di utilizzare la cache e possono influire negativamente sulle prestazioni della cache. Puoi attivare i commenti relativi al contesto per una connessione BigQuery disattivando l'opzione di attivazione/disattivazione Disattiva contesto. Per ulteriori informazioni, consulta la sezione Etichette dei job e commenti sul contesto per le connessioni BigQuery.

  • Pre-cache SQL Runner: se non vuoi che SQL Runner precarichi le informazioni sulle tabelle, ma preferisci che le carichi solo quando una tabella è selezionata, deseleziona questa opzione. Per ulteriori informazioni, consulta la sezione Precache SQL Runner della pagina Connessione di Looker al database.

Dopo aver compilato tutti i campi applicabili per la connessione, puoi testarla in base alle tue esigenze.

Per salvare queste impostazioni, fai clic su Connetti.

Test della connessione

Puoi testare le impostazioni di connessione in due punti dell'interfaccia utente di Looker:

  • Seleziona il pulsante Test nella parte inferiore della pagina Impostazioni connessioni, come descritto nella pagina della documentazione Connessione di Looker al database.
  • Seleziona il pulsante Test accanto alla voce della connessione nella pagina di amministrazione Connessioni, come descritto nella pagina della documentazione Connessioni.

Per le nuove connessioni, se Looker mostra Può essere collegata, seleziona Aggiungi connessione. Looker eseguirà il resto dei test di connessione per verificare che l'account di servizio sia stato configurato correttamente e con i ruoli appropriati.

Test di una connessione che utilizza OAuth

  1. In Looker, vai alla modalità di sviluppo.
  2. Per una connessione BigQuery esistente che utilizza OAuth, vai ai file del progetto di un progetto Looker che utilizza la connessione BigQuery. Per le nuove connessioni BigQuery che utilizzano OAuth, apri un file modello e sostituisci il valore connection del modello con il nome della nuova connessione BigQuery, quindi salva il file modello.
  3. Apri una delle esplorazioni o delle dashboard del modello ed esegui una query. Quando provi a eseguire una query, Looker ti chiederà di accedere con il tuo Account Google. Segui le istruzioni per accedere con Google OAuth.

Etichette dei job e commenti sul contesto per le connessioni BigQuery

Per le connessioni BigQuery, Looker invia il contesto della query sotto forma di etichette dei job BigQuery. Per impostazione predefinita, Looker invia le seguenti chiavi di etichetta del contesto per le connessioni BigQuery:

  • looker-context-user_id: identificatore univoco di ciascun utente nell'istanza di Looker. Puoi associare questo ID utente a quello visualizzato nella pagina Utenti del menu Amministrazione.
  • looker-context-history_slug: identificatore univoco di ogni query eseguita sul database dall'istanza di Looker.

  • looker-context-instance_slug: il numero ID dell'istanza di Looker che ha inviato la query. Se necessario, l'assistenza Looker può utilizzare queste informazioni ai fini della risoluzione dei problemi.

Puoi configurare etichette di job aggiuntive da inviare con ogni query sulla connessione BigQuery utilizzando il campo di testo Parametri JDBC aggiuntivi della pagina Connessioni. Nel campo Parametri JDBC aggiuntivi, aggiungi un parametro JDBC aggiuntivo, labels, e fornisci un elenco separato da virgole di coppie key=value con URL codificati. Ad esempio, se includi quanto segue nel campo Parametri JDBC aggiuntivi:

labels=this%3Dconnection-label,that%3Danother-connection-label

%3D è la codifica URL di =, quindi verranno aggiunte le due etichette seguenti a ogni query inviata da Looker al database BigQuery, oltre alle etichette di contesto di Looker predefinite:

  • this: connection-label
  • that: another-connection-label

Tieni presente che BigQuery ha limitazioni per le etichette dei job:

  • Qualsiasi etichetta di collegamento che abbia la stessa chiave di un'etichetta di contesto verrà ignorata.
  • Se l'unione delle etichette di connessione e delle etichette di contesto supera il massimo di 64 etichette totali, le etichette di contesto sono le prime a essere eliminate, seguite dalle etichette di connessione, fino a quando il numero totale di etichette non è pari o inferiore a 64.

Looker garantisce che le etichette di contesto siano conformi a tutti i requisiti di validità delle etichette di BigQuery, ma non controlla la validità delle etichette di connessione. La configurazione di etichette di connessione non valide può causare l'errore delle query.

Le etichette dei job BigQuery inviate da Looker per impostazione predefinita (looker-context-user_id, looker-context-history_id e looker-context-instance_slug) corrispondono ai commenti contestuali SQL che Looker associa alle query SQL per i dialetti di database diversi da BigQuery. Per le connessioni a BigQuery, i commenti relativi al contesto sono disabilitati per impostazione predefinita perché invalidano la capacità di BigQuery di utilizzare la cache e possono influire negativamente sulle prestazioni della cache. Puoi attivare i commenti relativi al contesto per una connessione BigQuery disattivando l'opzione di attivazione/disattivazione Disattiva contesto per la connessione BigQuery. Ti consigliamo di mantenere l'impostazione predefinita per Disattiva commento relativo al contesto, in modo da poter utilizzare la cache di BigQuery. Tuttavia, se deselezioni l'opzione Disattiva commento relativo al contesto per una connessione BigQuery, Looker invierà al database i commenti relativi al contesto SQL e le etichette dei job BigQuery.

I commenti contestuali SQL e le etichette dei job BigQuery trasmettono le stesse informazioni. Ad esempio, Looker potrebbe generare i seguenti commenti sul contesto SQL per una query:

-- Looker Query Context

'{"user_id":1,"history_id":4757,"instance_slug":"ec2804ddef74c466f2a43e0afaa3ff6b"}'

Looker genererà le seguenti etichette dei job BigQuery per la stessa query:

[{"value":"1","key":"looker-context-user_id"},

 {"value":"4757","key":"looker-context-history_id"},

 {"value":"ec2804ddef74c466f2a43e0afaa3ff6b","key":"looker-context-instance_slug"}]

Funzionalità supportate

Affinché Looker supporti alcune funzionalità, anche il dialetto del database deve supportarle.

SQL standard di Google BigQuery

A partire da Looker 24.20, Google BigQuery Standard SQL supporta le seguenti funzionalità:

Funzionalità Supportato?
Livello di assistenza
Supportato
Looker (Google Cloud core)
Aggregati simmetrici
Tabelle derivate
Tabelle derivate SQL permanenti
Tabelle derivate native permanenti
Visualizzazioni stabili
Interruzioni delle query
No
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Percentile distinto
Processi di visualizzazione di SQL Runner
No
Tabella Describe di SQL Runner
No
Indici di SQL Runner Show
No
SQL Runner Select 10
Conteggio di SQL Runner
SQL Explain
No
Credenziali OAuth
Commenti contestuali
Pool di connessioni
No
Schizzi HLL
Aggregate Awareness
PDT incrementali
Millisecondi
Microsecondi
Viste materializzate
Conteggio approssimativo valori distinti

SQL precedente di Google BigQuery

A partire da Looker 24.20, Google BigQuery Legacy SQL supporta le seguenti funzionalità:

Funzionalità Supportato?
Livello di assistenza
Supportato
Looker (Google Cloud core)
No
Aggregati simmetrici
Tabelle derivate
Tabelle derivate SQL permanenti
Tabelle derivate native permanenti
Visualizzazioni stabili
No
Interruzioni delle query
Pivot basati su SQL
Fusi orari
No
SSL
Subtotali
No
Parametri aggiuntivi JDBC
Sensibilità alle maiuscole
Tipo di località
Tipo di elenco
Percentile
Percentile distinto
Processi di visualizzazione di SQL Runner
No
Tabella Describe di SQL Runner
No
Indici di SQL Runner Show
No
SQL Runner Select 10
Conteggio di SQL Runner
SQL Explain
No
Credenziali OAuth
Commenti contestuali
Pool di connessioni
No
Schizzi HLL
No
Aggregate Awareness
PDT incrementali
No
Millisecondi
Microsecondi
Viste materializzate
No
Conteggio approssimativo valori distinti

Passaggi successivi

Dopo aver collegato il database a Looker, configura le opzioni di accesso per gli utenti.