Suggerimenti per la combinazione e concetti avanzati

Questo articolo fornisce consigli e informazioni approfondite sulla combinazione dei dati per aiutarti a comprendere il funzionamento della combinazione e a risolvere casi d'uso complessi. Per trarre il massimo vantaggio da questo articolo, dovresti già conoscere le nozioni di base dell'unione dei dati, trattate negli altri articoli di questo argomento.

Le combinazioni devono contenere solo un sottoinsieme dei dati disponibili

Come best practice, devi includere solo i campi specifici che vuoi visualizzare nei grafici basati su una combinazione. Ecco perché è importante:

  • La combinazione può generare set di dati molto grandi, il che può portare a un rallentamento delle prestazioni e a possibili costi di query più elevati per i servizi a pagamento come BigQuery.
  • I grafici basati su combinazioni calcolano tutte le righe nella combinazione anche se non sono utilizzate nel grafico.
    • Ad esempio, supponiamo che tu crei una combinazione contenente dieci campi, poi definisci un grafico che ne utilizza solo uno. Looker Studio calcola l'unione di dieci campi, poi esegue una query su quel campo nell'output dell'unione per creare il grafico.
    • La riaggregazione si verifica solo se la combinazione contiene un sottoinsieme dei dati sottostanti.

Utilizzare la combinazione per riaggregare le metriche

Le metriche che includi dall'origine dati sottostante diventano numeri non aggregati in una combinazione. Quando la combinazione include un numero di campi inferiore all'intero set dalle origini dati sottostanti, questi numeri vengono riaggregati in base ai nuovi dati. L'utilizzo della combinazione in questo modo può essere utile se devi applicare un'aggregazione diversa a un campo già aggregato, ad esempio il calcolo di una media di medie.

Per saperne di più, consulta Utilizzare la combinazione per riaggregare i dati.

Creare combinazioni da una singola origine dati

Le combinazioni non devono utilizzare origini dati diverse. Potresti anche trovare utile aggregare nuovamente i dati combinando più tabelle della stessa origine dati.

Ad esempio, supponiamo di avere un set di dati contenente i dati sulla popolazione delle tre contee più popolose degli stati più popolosi degli Stati Uniti, come mostrato nella tabella seguente:

Stato

Contea

Popolazione (stima del 2023)

California

Contea di Los Angeles

10.014.009

California

Contea di San Diego

3.298.634

California

Orange County

3.186.989

Texas

Contea di Harris

4.731.145

Texas

Contea di Dallas

2.613.539

Texas

Contea di Tarrant

2.110.640

New York

Contea di Kings (Brooklyn)

2.736.074

New York

Contea di Queens

2.405.464

New York

Contea di Bronx

1.418.890

Vuoi calcolare la percentuale di popolazione per ogni contea dello stato, ma per farlo devi avere la popolazione totale di ogni stato come campo a sé stante. Nel set di dati questa metrica non è disponibile, ma puoi ottenerla combinando l'origine dati della popolazione con se stessa seguendo questi passaggi:

  1. Crea un'origine dati utilizzando il set di dati di base.
  2. Aggiungi un grafico che utilizza l'origine dati a un report.
  3. Crea un'unione con due tabelle. Ogni tabella utilizzerà la stessa origine dati creata nel passaggio 1.
    1. Per la Tabella 1, includi i seguenti campi:
      1. Stato, Contea, Popolazione.
      2. Rinomina Popolazione in PopolazioneContea.
    2. Per la tabella 2, includi il campo Popolazione e rinominalo in PopolazioneStato.
  4. Per la condizione di join, utilizza un join esterno sinistro, collegando Stato nella tabella 1 a Stato nella tabella 2.
  5. Fai clic su Salva.
  6. Torna all'editor del report facendo clic sulla X.

Aggiungi un nuovo grafico (ad esempio una tabella) al report e seleziona l'unione come origine dati per il grafico seguendo questa procedura:

  1. Aggiungi al grafico i campi Stato, Provincia, PopolazioneProvincia e PopolazioneStato.
  2. Per calcolare la percentuale di popolazione dello stato per ogni contea, aggiungi al grafico un campo calcolato che utilizzi i nuovi dati aggregati:
    1. Nel riquadro delle proprietà, fai clic su Aggiungi metrica e poi su Aggiungi campo.
    2. Assegna al campo il nome Percentuale della popolazione statale.
    3. Nella casella Formula, inserisci (CountyPopulation / StatePopulation)*100.
    4. (Facoltativo) Imposta il Formato di visualizzazione in modo da mostrare i valori percentuali al livello desiderato (ad es. Percentuale (2) per due cifre decimali).

Al termine, la tabella dovrebbe avere il seguente aspetto:

Stato

Contea

CountyPopulation

StatePopulation

Percentuale della popolazione dello stato

California

Contea di Los Angeles

10014009

16499632

60,69

Texas

Contea di Harris

4731145

9455324

50,04

California

Contea di San Diego

3298634

16499632

19,99

California

Orange County

3186989

16499632

19,32

New York

Contea di Kings (Brooklyn)

2736074

6560428

41,71

Texas

Contea di Dallas

2613539

9455324

27,64

New York

Contea di Queens

2405464

6560428

36,67

Texas

Contea di Tarrant

2110640

9455324

22,32

New York

Contea di Bronx

1418890

6560428

21,63

Ordine della tabella nella combinazione

Looker Studio valuta le configurazioni di join nella combinazione in ordine, partendo da quella più a sinistra. I risultati di ogni join vengono poi applicati al successivo join a destra. Ad esempio, in una combinazione di tre tabelle, viene valutata la configurazione di join tra la tabella 1 (più a sinistra) e la tabella 2 (al centro), quindi i risultati vengono utilizzati dalla configurazione di join tra la tabella 2 e la tabella 3 (più a destra).

Ordine della tabella nelle combinazioni create automaticamente

Quando combini una selezione di grafici, Looker Studio crea una tabella per ogni grafico e aggiunge i campi del grafico alla tabella corrispondente. L'ordine delle tabelle nella combinazione corrisponde all'ordine in cui selezioni i grafici: il primo grafico selezionato diventa la prima tabella (più a sinistra), il secondo grafico selezionato diventa la seconda tabella e così via.

Looker Studio crea automaticamente anche una configurazione di join per ogni tabella e utilizza il tipo di join esterno sinistro.

Se la configurazione predefinita non è quella che vuoi o se non sono presenti collegamenti chiari tra le tabelle, puoi modificare la combinazione in base ai tuoi obiettivi.

Le tabelle vengono create prima della combinazione

Viene eseguita una query sui dati di ogni tabella in una combinazione prima che venga creata la combinazione finale. Gli intervalli di date, i filtri e i campi calcolati di una tabella vengono applicati alla query che genera la tabella prima che vengano eseguiti i join. Questi fattori possono influire sui dati inclusi nelle tabelle di combinazione e modificare l'output della combinazione.

Le combinazioni possono contenere più righe rispetto ai dati originali

In un grafico combinato potresti vedere più dati rispetto a quelli riportati nei grafici basati sulle singole origini dati che costituiscono la combinazione. Il risultato può dipendere dai dati e dalla configurazione di join scelta per la combinazione. Ad esempio, un join esterno sinistro include tutti i record della tabella a sinistra, nonché tutti i record delle tabelle a destra che condividono gli stessi valori nella condizione di join. Più corrispondenze per la condizione di join possono comportare la visualizzazione di più righe nei dati combinati rispetto a quelle esistenti nell'origine dati più a sinistra.

Combinazioni e intervalli di date e filtri espliciti

Per limitare il numero di righe nelle combinazioni, puoi utilizzare un intervallo di date o applicare un filtro. Puoi limitare le righe nei grafici basati su un'unione o nelle tabelle che la compongono. È utile pensare al processo come "pre-blend" o "post-blend".

Quando viene applicato a una tabella della combinazione, un intervallo di date o un filtro ha effetto prima che i dati vengano uniti alle altre tabelle della combinazione. Le righe che non rientrano nell'intervallo di date o che vengono escluse dal filtro non sono prese in considerazione nella query di join.

Quando applichi un intervallo di date o un filtro a un grafico basato su una combinazione, lo applichi ai dati dopo la creazione della combinazione ("dopo la combinazione").

Questa differenza potrebbe influire notevolmente sui risultati visualizzati nei grafici, a seconda dei dati e della configurazione della combinazione.

Combinazioni e filtri ereditati

Le combinazioni ereditano i filtri a livello di report, pagina o gruppo, a condizione che il filtro sia compatibile con i dati prima o dopo la combinazione. Se il filtro è compatibile con le origini dati sottostanti utilizzate dalla combinazione, interviene sui dati prima della combinazione. In caso contrario, il filtro agisce sui dati dopo la combinazione. Se non è compatibile con i dati prima o dopo la combinazione, il filtro viene ignorato.

Scopri di più sull'ereditarietà dei filtri.

Quando un grafico basato su un'unione è soggetto a un filtro ereditato, Looker Studio elabora i dati in cinque passaggi:

(Pre-blend):

  • Passaggio 1: i dati vengono raggruppati e aggregati in base alle dimensioni specificate nel riquadro Combina dati.
  • Passaggio 2: i filtri delle dimensioni ereditati e i filtri delle metriche compatibili vengono applicati alle origini dati incluse nel riquadro Combina dati.

(Blend):

  • Passaggio 3: i dati vengono combinati utilizzando la configurazione di join specificata.

(Post-blend):

  • Passaggio 4: i dati vengono raggruppati e aggregati in base alle dimensioni nel grafico.
  • Passaggio 5: al grafico vengono applicati i filtri delle metriche, se compatibili con i dati combinati.