Dicas de combinação e conceitos avançados

Neste artigo, mostramos conselhos e informações detalhadas sobre a combinação de dados para ajudar você a entender como ela funciona e resolver casos de uso complexos. Para aproveitar ao máximo este artigo, você precisa conhecer os conceitos básicos da mesclagem de dados, que são abordados nos outros artigos deste tópico.

As combinações precisam conter apenas um subconjunto dos dados disponíveis

Uma prática recomendada é incluir apenas os campos específicos que você quer visualizar nos gráficos com base em uma combinação. Confira por que isso é importante:

  • A combinação pode criar conjuntos de dados muito grandes, resultando em baixa performance e custos de consulta mais elevados em serviços pagos, como o BigQuery.
  • Os gráficos com base em combinações calculam todas as linhas na combinação, mesmo que elas não sejam usadas no gráfico.
    • Por exemplo, digamos que você crie uma combinação contendo 10 campos. Em seguida, defina um gráfico que use apenas um deles. O Looker Studio calcula a combinação de 10 campos e consulta esse campo no resultado para criar o gráfico.
    • A reagregação só acontece se a combinação tiver um subconjunto dos dados subjacentes.

Usar a combinação para reagregar métricas

As métricas incluídas na fonte de dados subjacente se tornam números não agregados em uma combinação. Quando a combinação inclui menos do que o conjunto completo de campos da fonte de dados subjacente, esses números são agregados novamente com base nos novos dados. Usar a combinação dessa forma pode ser útil quando você precisa aplicar uma agregação diferente a um campo já agregado, como calcular uma média de médias.

Consulte Usar a combinação para reagregar dados para mais informações.

Criar combinações com base em uma única fonte de dados

As mesclagens não precisam usar fontes de dados diferentes. Também pode ser útil reagrupar os dados combinando várias tabelas da mesma fonte.

Por exemplo, digamos que você tenha um conjunto de dados com dados de população dos três condados mais populosos dos estados mais populosos dos EUA, conforme mostrado na tabela a seguir:

Estado

Condado

População (estimativa de 2023)

Califórnia

Condado de Los Angeles

10.014.009

Califórnia

Condado de San Diego

3.298.634

Califórnia

Condado de Orange

3.186.989

Texas

Condado de Harris

4.731.145

Texas

Condado de Dallas

2.613.539

Texas

Condado de Tarrant

2.110.640

Nova York

Condado de Kings (Brooklyn)

2.736.074

Nova York

Queens County

2.405.464

Nova York

Condado de Bronx

1.418.890

Você quer calcular a porcentagem da população de cada município do estado. Para isso, é necessário ter o total da população de cada estado como um campo. No conjunto de dados, essa métrica não está disponível, mas você pode fazer a combinação da sua fonte de dados de população com ela mesma seguindo estas etapas:

  1. Crie uma fonte de dados usando o conjunto de dados de origem.
  2. Adicione um gráfico que use essa fonte de dados a um relatório.
  3. Crie uma mesclagem com duas tabelas. Cada tabela vai usar a mesma fonte de dados criada na etapa 1.
    1. Na Tabela 1, inclua os seguintes campos:
      1. Estado, Condado, População.
      2. Renomeie População para População do condado.
    2. Na Tabela 2, basta incluir o campo População e renomeá-lo como População do estado.
  4. Para a condição de combinação, use uma mesclagem externa à esquerda, vinculando Estado na Tabela 1 a Estado na Tabela 2.
  5. Clique em Salvar.
  6. Para voltar ao editor de relatórios, clique no X.

Em seguida, adicione um novo gráfico (por exemplo, uma tabela) ao relatório e selecione a combinação como a fonte de dados do gráfico seguindo estas etapas:

  1. Adicione os campos Estado, Condado, População do condado e População do estado ao gráfico.
  2. Para calcular a porcentagem da população do estado para cada condado, adicione um campo calculado ao gráfico que usa os novos dados reagrupados:
    1. No painel de propriedades, clique em Adicionar métrica e em Adicionar campo.
    2. Nomeie o campo (por exemplo) Percentual da população do estado.
    3. Na caixa Fórmula, digite (CountyPopulation / StatePopulation)*100.
    4. (Opcional) Defina o Formato de exibição para mostrar os valores de porcentagem no nível desejado (por exemplo, Porcentagem (2) para dois dígitos decimais).

Quando terminar, a tabela vai ficar assim:

Estado

Condado

CountyPopulation

StatePopulation

Porcentagem da população do estado

Califórnia

Condado de Los Angeles

10014009

16499632

60,69

Texas

Condado de Harris

4731145

9455324

50,04

Califórnia

Condado de San Diego

3298634

16499632

19,99

Califórnia

Condado de Orange

3186989

16499632

19,32

Nova York

Condado de Kings (Brooklyn)

2736074

6560428

41,71

Texas

Condado de Dallas

2613539

9455324

27,64

Nova York

Queens

2405464

6560428

36,67

Texas

Condado de Tarrant

2110640

9455324

22.32

Nova York

Condado de Bronx

1418890

6560428

21,63

Ordem de tabelas na combinação

O Looker Studio avalia as configurações de agrupamento na combinação em ordem, começando pela configuração mais à esquerda. Os resultados de cada agrupamento são utilizados no próximo à direita. Por exemplo, em uma combinação de três tabelas, a configuração de mesclagem entre a tabela 1 (mais à esquerda) e a tabela 2 (meio) é avaliada, e esses resultados são usados pela configuração de mesclagem entre a tabela 2 e a tabela 3 (mais à direita).

Ordem de tabelas em combinações criadas automaticamente

Quando você combina uma seleção de gráficos, o Looker Studio cria uma tabela para cada um deles e adiciona os campos à tabela correspondente. A ordem das tabelas na combinação segue a ordem de seleção dos gráficos: o primeiro gráfico selecionado se torna a primeira tabela (à esquerda), o segundo gráfico, a segunda tabela e assim por diante.

O Looker Studio também cria automaticamente uma configuração de mesclagem para cada tabela e usa o tipo de mesclagem externo à esquerda.

Se a configuração padrão não for a que você quer ou se não houver vinculações claras entre as tabelas, edite a combinação de acordo com suas metas.

As tabelas são criadas antes da combinação

Os dados de cada tabela em uma combinação são consultados antes de serem mesclados à combinação final. Os períodos, filtros e campos calculados em uma tabela são usados na consulta que gera a tabela antes de qualquer mesclagem ser realizada. Esses fatores podem afetar os dados incluídos nas tabelas de combinação e mudar o resultado da combinação.

As combinações podem conter mais linhas do que os dados originais

Talvez você veja mais dados em um gráfico combinado do que em gráficos com base nas fontes de dados individuais que compõem a combinação. O resultado pode depender dos seus dados e da configuração de mesclagem escolhida para a combinação. Por exemplo, uma mesclagem externa à esquerda inclui todos os registros da tabela à esquerda, além de todos os registros das tabelas à direita que têm os mesmos valores em toda a condição de mesclagem. Várias correspondências para a condição de agrupamento podem resultar em mais linhas de dados combinados do que na fonte de dados mais à esquerda.

Combinações e filtros e períodos explícitos

Duas formas de limitar o número de linhas nas combinações são usar um período ou um filtro. É possível limitar as linhas em gráficos com base em uma combinação ou nas tabelas que compõem a combinação. É útil pensar no processo como sendo "pré-combinado" ou "pós-combinado".

Quando você aplica um filtro ou período a uma tabela na combinação, ele entra em vigor antes de os dados serem mesclados às outras tabelas na combinação. As linhas fora do período ou excluídas pelo filtro não ficam disponíveis para a consulta de agrupamento.

Quando você aplica um período ou filtro a um gráfico com base em uma combinação, ele é usado nos dados depois que a combinação é criada ("pós-combinação").

Essa diferença pode ter um grande impacto nos resultados mostrados nos gráficos, dependendo dos seus dados e de como você configurou a combinação.

Combinações e filtros herdados

As combinações herdam os filtros no nível do relatório, da página ou do grupo, desde que o filtro seja compatível com os dados de antes ou depois da combinação. Se o filtro for compatível com as fontes de dados associadas usadas pela combinação, ele vai filtrar os dados pré-combinados. Caso contrário, o filtro é aplicado aos dados pós-combinados. Se o filtro não for compatível com os dados pré ou pós-combinação, ele será ignorado.

Saiba mais sobre a herança de filtros.

Quando um gráfico com base em uma combinação está sujeito a um filtro herdado, o Looker Studio processa os dados em cinco etapas:

(pré-mistura):

  • Etapa 1:os dados são agrupados e agregados com base nas dimensões especificadas no painel Combinar dados.
  • Etapa 2:os filtros de dimensão herdados e de métricas compatíveis são aplicados às fontes de dados incluídas no painel Combinar dados.

(Blend):

  • Etapa 3:os dados são combinados usando a configuração de mesclagem especificada.

(Pós-mistura):

  • Etapa 4:os dados são agrupados e agregados de acordo com as dimensões no gráfico.
  • Etapa 5:os filtros de métrica, quando compatíveis com os dados combinados, são usados no gráfico.