I Looker Blocks™ sono modelli di dati predefiniti per pattern di analisi e origini dati comuni. Consentono di riutilizzare il lavoro già svolto da altri invece di partire da zero, personalizzando poi i blocchi in base alle esatte specifiche. Da pattern SQL ottimizzati a modelli dei dati completamente strutturati, Looker Blocks può essere utilizzato come punto di partenza per una modellazione dei dati rapida e flessibile in Looker.
Blocchi disponibili
La scelta di blocchi di Looker è ampia. Per sapere quali sono disponibili, puoi consultare la sezione Blocks (Blocchi) di Looker Marketplace.
Fai clic su un blocco a cui ti interessa visualizzare le istruzioni per l'uso specifiche.
Alcuni Looker Blocks sono facili e rapidi da installare tramite Looker Marketplace. Prima di poter eseguire il deployment di un blocco tramite Looker Marketplace, un amministratore di Looker deve aver abilitato la funzionalità Marketplace. L'installazione di blocchi che contengono un parametro local_dependency
richiede inoltre di abilitare la funzionalità Labs Importazione progetto locale. Consulta la pagina della documentazione di Looker Marketplace per saperne di più sull'installazione e sulla personalizzazione di Looker Blocks, disponibile in Looker Marketplace.
Standardizzazione e personalizzazione
La facilità di utilizzo dei diversi blocchi varia a seconda del grado di standardizzazione dello schema del database. La maggior parte dei Looker Blocks richiede un certo grado di personalizzazione per adattarsi allo schema dei dati, ad eccezione dei blocchi di dati, che sono i più semplici da implementare ma non possono essere personalizzati.
I blocchi di dati, che includono set di dati pubblici e modelli LookML completi, richiedono semplicemente la copia del modello LookML dal repository GitHub per accedere alle tabelle modellate. Per istruzioni dettagliate, consulta la sezione Uso dei blocchi di dati in questa pagina.
Le applicazioni di raccolta dati, come Segment e Snowplow, monitorano gli eventi in un formato relativamente standardizzato. Questo consente di creare pattern di progettazione modellizzati, in grado di supportare la pulizia, la trasformazione e l'analisi dei dati e disponibili per qualsiasi cliente utilizzi queste applicazioni.
Altre applicazioni web, come Salesforce, consentono di aggiungere campi personalizzati per gli utenti interni. Naturalmente, questo produce dati in un formato meno standardizzato. Ne consegue che, da parte nostra, possiamo modellizzare parte del modello dei dati per consentire l'analisi, ma sarà necessario provvedere a personalizzare la porzione non standardizzata.
Infine, abbiamo dei blocchi per gli insight aziendali generali. Si tratta di pattern di progettazione SQL o LookML ottimizzati e indipendenti dall'origine dati. Ad esempio, molte società vogliono analizzare il lifetime value di un cliente nel corso del tempo. Questi pattern si basano su alcuni presupposti incorporati, ma possono essere personalizzati per soddisfare esigenze aziendali specifiche. I pattern riflettono il punto di vista di Looker su quale sia il modo migliore per svolgere determinati tipi di analisi.
Se non hai mai utilizzato Looker, il tuo analista di Looker può aiutarti a ottenere il massimo da questi modelli.
Aggiunta di blocchi a LookML
- Alcuni blocchi mostrano sia le esplorazioni che le visualizzazioni nello stesso file. Questo è per facilitare la visualizzazione, ma in generale ti consigliamo di copiare le sezioni appropriate di LookML nelle posizioni appropriate nel tuo modello dei dati. Per ulteriori informazioni, consulta la pagina della documentazione Informazioni sul modello e sui file di visualizzazione.
- In alcuni casi, probabilmente ti consigliamo di creare nuovi file LookML nel modello di dati per contenere gli esempi.
Utilizzare i blocchi di dati
I blocchi di dati sono un tipo speciale di Looker Block che fornisce il set di dati e il modello dei dati. I blocchi di dati Looker includono origini dati pubbliche, tra cui:
- Dati demografici: metriche demografiche comuni dell'American Community Survey a livello di stato, contea, area di tabulazione dei codici postali e persino a livello di gruppo di blocchi di censimenti.
- Dati meteo: rapporti sul meteo negli Stati Uniti a livello di codice postale, dal 1920 al giorno precedente. Questo blocco viene aggiornato ogni notte.
Per un elenco completo dei blocchi disponibili, consulta la sezione Blocks (Blocchi) di Looker Marketplace.
Accesso a set di dati su database diversi
La procedura per accedere al set di dati di un blocco di dati varia a seconda dello schema del database. Le seguenti sezioni contengono istruzioni per accedere ai set di dati su questi database:
Accesso ai set di dati su Google BigQuery
Se hai già un account Google BigQuery, puoi accedere ai set di dati ospitati in BigQuery su Looker. Passa direttamente alla sezione Aggiunta di blocchi di dati ai progetti in questa pagina.
Se non hai ancora un account Google BigQuery, puoi configurare una prova gratuita e poi accedere ai set di dati pubblici di Looker su BigQuery.
Accesso a set di dati su altri database
Utilizzi Amazon Redshift, MySQL, PostgreSQL o Oracle?
Abbiamo reso disponibili pubblicamente i dati trasformati per ciascuno di questi set di dati sia in Google Cloud Service che in S3, in modo che tu possa importarli direttamente nel database che preferisci.
Inoltre, abbiamo reso disponibile il DDL (Data Definition Language) per ciascuno dei set di dati nel repository GitHub. Le istruzioni DDL potrebbero dover essere modificate per i tipi di dati nel database selezionato, ma dovrebbero fornire un'idea dei tipi di colonne per ogni tabella.
Scaricare i dati direttamente da una di queste posizioni:
- Servizio Google Cloud:
_gs://looker-datablocks/_
- S3:
_s3://looker-datablocks/_
- Link web del bucket S3: http://looker-datablocks.s3-website-us-east-1.amazonaws.com/
Accesso al modello LookML
Crea un fork di uno dei nostri repository GitHub in un nuovo repository GitHub (ospitato da Looker o dalla tua azienda) che puoi poi extend o perfezionare all'interno della tua istanza:
- Dati demografici (Sondaggio sulla community americana): https://github.com/llooker/datablocks-acs
- Meteo (GSOD): https://github.com/llooker/datablocks-gsod
Aggiunta di blocchi di dati ai progetti
Oltre al metodo descritto in questa sezione, puoi anche utilizzare i perfezionamenti LookML per creare sul LookML delle viste e delle esplorazioni nei tuoi progetti.
Per aggiungere un data block al tuo progetto:
Aggiungi un nuovo progetto all'istanza Looker.
Fork o copia i repository GitHub menzionati in precedenza per accedere a LookML predefiniti. Assicurati di creare un nuovo repository GitHub.
Rimuovi gli altri file di dialetti di database dal repository. In genere, i blocchi di Looker contengono file per Google BigQuery, Amazon Redshift e Snowflake. Ad esempio, se stai configurando blocchi di dati su Google BigQuery, avrai solo bisogno dei file di visualizzazione di Google BigQuery, del file di esplorazione di Google BigQuery e del file del modello di Google BigQuery.
Sostituisci il nome della connessione nel file del modello con la connessione al database in cui si trovano i dati per i blocchi di dati. Se utilizzi Google BigQuery o Snowflake, utilizza la connessione al database da cui eseguirai l'estensione o la perfezione.
Tutta la logica di join è presente in un file
.explore
in ciascuno dei repository. Si tratta del file che dovrai includere nei passaggi seguenti, dopo aver configurato il manifest del progetto.Nel progetto Looker principale in cui estenderai o perfezionerai i blocchi di dati, crea un file manifest del progetto.
Aggiungi il seguente codice LookML al file manifest del progetto per fare riferimento ai blocchi di dati nel progetto Looker principale:
project_name: "<your_project_name\>"
local_dependency: {
project: "<project_name_of_datablock\>"
}
Considerazioni e opzioni di configurazione
Google BigQuery: assicurati di utilizzare l'insieme corretto di file modellati. Se utilizzi Google BigQuery, ti consigliamo di fare riferimento a tutti i file con _bq_
nel nome file. Potresti dover adattare i dialetti del nostro modello Google BigQuery al dialetto del tuo database.
Estensioni: tutti i nostri progetti sono stati configurati per consentire le estensioni dai file di esplorazione, poiché le estensioni dei modelli potrebbero causare problemi con più connessioni.
Unione di tabelle derivate: puoi consultare la nostra documentazione per le tabelle derivate native. Puoi lasciare che sia Looker a scrivere SQL per te a diversi livelli di aggregazione sui nostri set di dati disponibili pubblicamente e unirli al tuo modello.
Unione di set di risultati: puoi anche scegliere di unire i set di risultati dei nostri set di dati con i tuoi dati combinando i set di risultati delle query.
Configurazione di esempio del set di dati demografici
Per accedere ai dati, scarica i dati non elaborati dai nostri bucket S3 o Google Cloud Service oppure connettiti a un database Looker.
Importa il modello Blocco di dati demografici da LookML come progetto separato nella tua istanza di Looker.
Utilizza il parametro
include
per importare il file della visualizzazione.Quindi, estendi o ottieni una versione più raffinata del file della visualizzazione oppure utilizza le tabelle derivate native per ottenere i dati al livello di aggregazione necessario per le esplorazioni.
Nel nostro esempio, poiché i dati demografici si trovano a un livello di aggregazione diverso rispetto al nostro set di dati di e-commerce (gruppo di isolati rispetto al codice postale), utilizziamo le tabelle derivate native per aggregare le statistiche fino al livello del codice postale. In questo modo vengono eliminate le complesse unioni molti-a-molti:
include: "/american_community_survey/bq.explore" view: zipcode_income_facts { derived_table: { persist_for: "10000 hours" explore_source: fast_facts { column: ZCTA5 { field: tract_zcta_map.ZCTA5 } column: income_household { field: bg_facts.avg_income_house } column: total_population { field: bg_facts.total_population } } } dimension: ZCTA5 {} dimension: income_household { hidden: yes }
Unisci i file di visualizzazione al modello:
include: "acs*.view" explore: order_items { join: users { sql_on: ${users.id} = ${order_items.user_id} ;; type: left_outer relationship: many_to_one } join: zipcode_income_facts { sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;; type: left_outer relationship: many_to_one } }
Esplora e visualizza i dati.
Uso dei blocchi di visualizzazione
Looker include una varietà di tipi di visualizzazione integrati. Tuttavia, se le esigenze di creazione di grafici non sono soddisfatte dai tipi di visualizzazione integrati di Looker, puoi anche aggiungere i tuoi tipi di visualizzazione personalizzata. Puoi anche sviluppare una visualizzazione personalizzata e renderla disponibile a tutti gli utenti di Looker da Looker Marketplace.
I blocchi di visualizzazione sono tipi di visualizzazione JavaScript predefiniti ospitati da Looker. I blocchi di visualizzazione aggiunti all'istanza Looker funzioneranno in modo simile a qualsiasi altro tipo di visualizzazione integrato di Looker: compariranno sulla barra dei menu di visualizzazione e includeranno funzionalità essenziali come visualizzazione in dettaglio, download, incorporamento e pianificazione.
Per scoprire di più su un blocco di visualizzazione, seleziona il tipo di visualizzazione nella sezione Plug-in del marketplace di Looker, poi fai clic su Visualizza il codice e vai al file READ.ME
del blocco di visualizzazione. Il file READ.ME
mostra un esempio della visualizzazione e fornisce ulteriori informazioni sul blocco. Per alcune visualizzazioni, il file READ.ME
fornisce inoltre un URL e istruzioni per aggiungere il blocco.
Per aggiungere il tipo di visualizzazione all'istanza, consulta le istruzioni nel file READ.ME
(se presenti) e le informazioni nella pagina della documentazione Visualizzazioni.