Neste artigo, mostramos conselhos e informações detalhadas sobre a combinação de dados para ajudar você a entender como ela funciona e resolver casos de uso complexos. Para aproveitar ao máximo este artigo, você precisa conhecer os conceitos básicos da mesclagem de dados, que são abordados nos outros artigos deste tópico.
As combinações precisam conter apenas um subconjunto dos dados disponíveis
Uma prática recomendada é incluir apenas os campos específicos que você quer visualizar nos gráficos com base em uma combinação. Confira por que isso é importante:
- A combinação pode criar conjuntos de dados muito grandes, resultando em baixa performance e custos de consulta mais elevados em serviços pagos, como o BigQuery.
- Os gráficos com base em combinações calculam todas as linhas na combinação, mesmo que elas não sejam usadas no gráfico.
- Por exemplo, digamos que você crie uma combinação contendo 10 campos. Em seguida, defina um gráfico que use apenas um deles. O Looker Studio calcula a combinação de 10 campos e consulta esse campo no resultado para criar o gráfico.
- A reagregação só acontece se a combinação tiver um subconjunto dos dados subjacentes.
Usar a combinação para reagregar métricas
As métricas incluídas na fonte de dados subjacente se tornam números não agregados em uma combinação. Quando a combinação inclui menos do que o conjunto completo de campos da fonte de dados subjacente, esses números são agregados novamente com base nos novos dados. Usar a combinação dessa forma pode ser útil quando você precisa aplicar uma agregação diferente a um campo já agregado, como calcular uma média de médias.
Consulte Usar a combinação para reagregar dados para mais informações.
Criar combinações com base em uma única fonte de dados
As mesclagens não precisam usar fontes de dados diferentes. Também pode ser útil reagrupar os dados combinando várias tabelas da mesma fonte.
Por exemplo, digamos que você tenha um conjunto de dados com dados de população dos três condados mais populosos dos estados mais populosos dos EUA, conforme mostrado na tabela a seguir:
Estado |
Condado |
População (estimativa de 2023) |
---|---|---|
Califórnia |
Condado de Los Angeles |
10.014.009 |
Califórnia |
Condado de San Diego |
3.298.634 |
Califórnia |
Condado de Orange |
3.186.989 |
Texas |
Condado de Harris |
4.731.145 |
Texas |
Condado de Dallas |
2.613.539 |
Texas |
Condado de Tarrant |
2.110.640 |
Nova York |
Condado de Kings (Brooklyn) |
2.736.074 |
Nova York |
Queens County |
2.405.464 |
Nova York |
Condado de Bronx |
1.418.890 |
Você quer calcular a porcentagem da população de cada município do estado. Para isso, é necessário ter o total da população de cada estado como um campo. No conjunto de dados, essa métrica não está disponível, mas você pode fazer a combinação da sua fonte de dados de população com ela mesma seguindo estas etapas:
- Crie uma fonte de dados usando o conjunto de dados de origem.
- Adicione um gráfico que use essa fonte de dados a um relatório.
- Crie uma mesclagem com duas tabelas. Cada tabela vai usar a mesma fonte de dados criada na etapa 1.
- Na Tabela 1, inclua os seguintes campos:
- Estado, Condado, População.
- Renomeie População para População do condado.
- Na Tabela 2, basta incluir o campo População e renomeá-lo como População do estado.
- Na Tabela 1, inclua os seguintes campos:
- Para a condição de combinação, use uma mesclagem externa à esquerda, vinculando Estado na Tabela 1 a Estado na Tabela 2.
- Clique em Salvar.
- Para voltar ao editor de relatórios, clique no X.
Em seguida, adicione um novo gráfico (por exemplo, uma tabela) ao relatório e selecione a combinação como a fonte de dados do gráfico seguindo estas etapas:
- Adicione os campos Estado, Condado, População do condado e População do estado ao gráfico.
- Para calcular a porcentagem da população do estado para cada condado, adicione um campo calculado ao gráfico que usa os novos dados reagrupados:
- No painel de propriedades, clique em Adicionar métrica e em Adicionar campo.
- Nomeie o campo (por exemplo) Percentual da população do estado.
- Na caixa Fórmula, digite
(CountyPopulation / StatePopulation)*100
. - (Opcional) Defina o Formato de exibição para mostrar os valores de porcentagem no nível desejado (por exemplo, Porcentagem (2) para dois dígitos decimais).
Quando terminar, a tabela vai ficar assim:
Estado |
Condado |
CountyPopulation |
StatePopulation |
Porcentagem da população do estado |
---|---|---|---|---|
Califórnia |
Condado de Los Angeles |
10014009 |
16499632 |
60,69 |
Texas |
Condado de Harris |
4731145 |
9455324 |
50,04 |
Califórnia |
Condado de San Diego |
3298634 |
16499632 |
19,99 |
Califórnia |
Condado de Orange |
3186989 |
16499632 |
19,32 |
Nova York |
Condado de Kings (Brooklyn) |
2736074 |
6560428 |
41,71 |
Texas |
Condado de Dallas |
2613539 |
9455324 |
27,64 |
Nova York |
Queens |
2405464 |
6560428 |
36,67 |
Texas |
Condado de Tarrant |
2110640 |
9455324 |
22.32 |
Nova York |
Condado de Bronx |
1418890 |
6560428 |
21,63 |
Ordem de tabelas na combinação
O Looker Studio avalia as configurações de agrupamento na combinação em ordem, começando pela configuração mais à esquerda. Os resultados de cada agrupamento são utilizados no próximo à direita. Por exemplo, em uma combinação de três tabelas, a configuração de mesclagem entre a tabela 1 (mais à esquerda) e a tabela 2 (meio) é avaliada, e esses resultados são usados pela configuração de mesclagem entre a tabela 2 e a tabela 3 (mais à direita).
Ordem de tabelas em combinações criadas automaticamente
Quando você combina uma seleção de gráficos, o Looker Studio cria uma tabela para cada um deles e adiciona os campos à tabela correspondente. A ordem das tabelas na combinação segue a ordem de seleção dos gráficos: o primeiro gráfico selecionado se torna a primeira tabela (à esquerda), o segundo gráfico, a segunda tabela e assim por diante.
O Looker Studio também cria automaticamente uma configuração de mesclagem para cada tabela e usa o tipo de mesclagem externo à esquerda.
Se a configuração padrão não for a que você quer ou se não houver vinculações claras entre as tabelas, edite a combinação de acordo com suas metas.
As tabelas são criadas antes da combinação
Os dados de cada tabela em uma combinação são consultados antes de serem mesclados à combinação final. Os períodos, filtros e campos calculados em uma tabela são usados na consulta que gera a tabela antes de qualquer mesclagem ser realizada. Esses fatores podem afetar os dados incluídos nas tabelas de combinação e mudar o resultado da combinação.
As combinações podem conter mais linhas do que os dados originais
Talvez você veja mais dados em um gráfico combinado do que em gráficos com base nas fontes de dados individuais que compõem a combinação. O resultado pode depender dos seus dados e da configuração de mesclagem escolhida para a combinação. Por exemplo, uma mesclagem externa à esquerda inclui todos os registros da tabela à esquerda, além de todos os registros das tabelas à direita que têm os mesmos valores em toda a condição de mesclagem. Várias correspondências para a condição de agrupamento podem resultar em mais linhas de dados combinados do que na fonte de dados mais à esquerda.
Combinações e filtros e períodos explícitos
Duas formas de limitar o número de linhas nas combinações são usar um período ou um filtro. É possível limitar as linhas em gráficos com base em uma combinação ou nas tabelas que compõem a combinação. É útil pensar no processo como sendo "pré-combinado" ou "pós-combinado".
Quando você aplica um filtro ou período a uma tabela na combinação, ele entra em vigor antes de os dados serem mesclados às outras tabelas na combinação. As linhas fora do período ou excluídas pelo filtro não ficam disponíveis para a consulta de agrupamento.
Quando você aplica um período ou filtro a um gráfico com base em uma combinação, ele é usado nos dados depois que a combinação é criada ("pós-combinação").
Essa diferença pode ter um grande impacto nos resultados mostrados nos gráficos, dependendo dos seus dados e de como você configurou a combinação.
Combinações e filtros herdados
As combinações herdam os filtros no nível do relatório, da página ou do grupo, desde que o filtro seja compatível com os dados de antes ou depois da combinação. Se o filtro for compatível com as fontes de dados associadas usadas pela combinação, ele vai filtrar os dados pré-combinados. Caso contrário, o filtro é aplicado aos dados pós-combinados. Se o filtro não for compatível com os dados pré ou pós-combinação, ele será ignorado.
Saiba mais sobre a herança de filtros.
Quando um gráfico com base em uma combinação está sujeito a um filtro herdado, o Looker Studio processa os dados em cinco etapas:
(pré-mistura):
- Etapa 1:os dados são agrupados e agregados com base nas dimensões especificadas no painel Combinar dados.
- Etapa 2:os filtros de dimensão herdados e de métricas compatíveis são aplicados às fontes de dados incluídas no painel Combinar dados.
(Blend):
- Etapa 3:os dados são combinados usando a configuração de mesclagem especificada.
(Pós-mistura):
- Etapa 4:os dados são agrupados e agregados de acordo com as dimensões no gráfico.
- Etapa 5:os filtros de métrica, quando compatíveis com os dados combinados, são usados no gráfico.