Combinación de sugerencias y conceptos avanzados

En este artículo, se proporcionan consejos y detalles sobre la combinación de datos para ayudarte a comprender cómo funciona y resolver casos de uso complejos. Para aprovechar al máximo este artículo, ya deberías estar familiarizado con los conceptos básicos de la combinación de datos, que se abordan en los otros artículos de este tema.

Las combinaciones deben contener solo un subconjunto de los datos disponibles.

Como práctica recomendada, solo debes incluir los campos específicos que deseas visualizar en los gráficos que se basan en una combinación. A continuación, te explicamos por qué es importante:

  • La combinación puede crear conjuntos de datos muy grandes, lo que puede provocar un rendimiento lento y, posiblemente, costos de consulta más altos para los servicios pagados, como BigQuery.
  • Los gráficos que se basan en combinaciones calculan todas las filas de la combinación, incluso si no se usan en el gráfico.
    • Por ejemplo, supongamos que creas una combinación que contiene 10 campos. Luego, defines un gráfico que solo usa 1 de esos campos. Looker Studio calcula la combinación de 10 campos y, luego, consulta ese 1 campo en el resultado de la combinación para crear el gráfico.
    • La reagregación solo se produce si la combinación contiene un subconjunto de los datos subyacentes.

Usa la combinación para volver a agregar métricas

Las métricas que incluyes de la fuente de datos subyacente se convierten en números no agregados en una combinación. Cuando la combinación incluye menos que el conjunto completo de campos de la fuente de datos subyacente, estas cifras se vuelven a agregar en función de los datos nuevos. El uso de la combinación de esta manera puede ser útil si necesitas aplicar una agregación diferente a un campo ya agregado, como calcular un promedio de promedios.

Consulta Cómo usar la combinación para volver a agregar datos para obtener más información.

Crea combinaciones a partir de una sola fuente de datos

Las combinaciones no tienen que usar diferentes fuentes de datos. También te puede resultar útil volver a agregar datos combinando varias tablas de la misma fuente de datos.

Por ejemplo, supongamos que tienes un conjunto de datos que contiene datos de población de los tres condados principales de los estados más poblados de EE.UU., como se muestra en la siguiente tabla:

Estado

Condado

Población (estimación de 2023)

California

Condado de Los Ángeles

10,014,009

California

Condado de San Diego

3,298,634

California

Condado de Orange

3,186,989

Texas

Condado de Harris

4,731,145

Texas

Condado de Dallas

2,613,539

Texas

Condado de Tarrant

2,110,640

Nueva York

Condado de Kings (Brooklyn)

2,736,074

Nueva York

Queens

2,405,464

Nueva York

Condado de Bronx

1,418,890

Supongamos que quieres calcular el porcentaje de población de cada condado del estado. Para ello, debes tener la población total de cada estado como su propio campo. En el conjunto de datos, esa métrica no está disponible, pero puedes obtenerla combinando tu fuente de datos de propagación con ella misma. Para ello, sigue estos pasos:

  1. Crea una fuente de datos con tu conjunto de datos de base.
  2. Agrega un gráfico que use esa fuente de datos a un informe.
  3. Crea una combinación con dos tablas. Cada tabla usará la misma fuente de datos que creaste en el paso 1.
    1. En la tabla 1, incluye los siguientes campos:
      1. Estado, Condado, Población.
      2. Cambia el nombre de Population a CountyPopulation.
    2. En la tabla 2, solo incluye el campo Population y cámbiale el nombre a StatePopulation.
  4. Para la condición de unión, usa una unión externa izquierda que vincule Estado en la tabla 1 con Estado en la tabla 2.
  5. Haz clic en Guardar.
  6. Para volver al editor de informes, haz clic en X.

A continuación, agrega un gráfico nuevo (por ejemplo, una tabla) a tu informe y selecciona la combinación como fuente de datos del gráfico. Para ello, sigue estos pasos:

  1. Agrega los campos Estado, Condado, Población del condado y Población del estado al gráfico.
  2. Para calcular el porcentaje de la población estatal de cada condado, agrega un campo calculado al gráfico que use tus nuevos datos reagregados:
    1. En el panel de propiedades, haz clic en Agregar métrica y, luego, en Agregar campo.
    2. Asigna un nombre al campo (por ejemplo, Porcentaje de la población estatal).
    3. En el cuadro Fórmula, ingresa (CountyPopulation / StatePopulation)*100.
    4. (Opcional) Establece el Formato de visualización para mostrar los valores de porcentaje en el nivel que desees (por ejemplo, Porcentaje (2) para dos dígitos decimales).

Cuando termines, la tabla debería verse de la siguiente manera:

Estado

Condado

CountyPopulation

StatePopulation

Porcentaje de la población estatal

California

Condado de Los Ángeles

10014009

16499632

60.69

Texas

Condado de Harris

4731145

9455324

50.04

California

Condado de San Diego

3298634

16499632

19.99

California

Condado de Orange

3186989

16499632

19.32

Nueva York

Condado de Kings (Brooklyn)

2736074

6560428

41.71

Texas

Condado de Dallas

2613539

9455324

27.64

Nueva York

Queens

2405464

6560428

36.67

Texas

Condado de Tarrant

2110640

9455324

22.32

Nueva York

Condado de Bronx

1418890

6560428

21.63

Orden de las tablas en la combinación

Looker Studio evalúa las configuraciones de unión en la combinación en orden, comenzando por la configuración más a la izquierda. Luego, los resultados de cada unión se aplican a la siguiente unión a la derecha. Por ejemplo, en una combinación de tres tablas, se evalúa la configuración de combinación entre la tabla 1 (más a la izquierda) y la tabla 2 (en el medio), y luego la configuración de combinación entre la tabla 2 y la tabla 3 (más a la derecha) usa esos resultados.

Orden de las tablas en las combinaciones creadas automáticamente

Cuando combinas una selección de gráficos, Looker Studio crea una tabla para cada uno y, luego, agrega los campos del gráfico a la tabla correspondiente. El orden de las tablas en la combinación coincide con el orden en que seleccionas los gráficos: el primer gráfico seleccionado se convierte en la primera tabla (la más a la izquierda), el segundo gráfico seleccionado se convierte en la segunda tabla, etcétera.

Looker Studio también crea automáticamente una configuración de unión para cada tabla y usa el tipo de unión externa izquierda.

Si la configuración predeterminada no es la que deseas o si no hay vínculos claros entre las tablas, puedes editar la combinación para que se adapte a tus objetivos.

Las tablas se crean antes de la combinación.

Los datos de cada tabla de una combinación se consultan antes de que se unan a la combinación final. Los intervalos de fechas, los filtros y los campos calculados de una tabla se aplican a la consulta que genera la tabla antes de que se realice cualquier unión. Estos factores pueden afectar los datos que se incluyen en las tablas de combinación y cambiar el resultado de la combinación.

Las combinaciones pueden contener más filas que los datos originales

Es posible que veas más datos en un gráfico combinado que en los gráficos basados en las fuentes de datos individuales que conforman la combinación. El resultado puede depender de tus datos y de la configuración de unión elegida para la combinación. Por ejemplo, una unión externa izquierda incluye todos los registros de la tabla de la izquierda, así como todos los registros de las tablas de la derecha que comparten los mismos valores en la condición de unión. Si hay varias coincidencias para la condición de unión, es posible que aparezcan más filas en los datos combinados que en la fuente de datos de la izquierda.

Combinaciones y filtros y períodos explícitos

Dos maneras de limitar la cantidad de filas en tus combinaciones son usar un período o aplicar un filtro. Puedes limitar las filas en los gráficos que se basan en una combinación o en las tablas que la conforman. Es útil pensar en el proceso como "antes de la combinación" o "después de la combinación".

Cuando aplicas un período o un filtro a una tabla de la combinación, se aplica antes de que los datos se unan con las otras tablas de la combinación. Las filas que están fuera del período o que el filtro excluye no están disponibles para que la consulta de unión funcione.

Cuando aplicas un período o un filtro a un gráfico basado en una combinación, lo aplicas a los datos después de que se crea la combinación ("después de la combinación").

Esta diferencia podría tener un gran impacto en los resultados que ves en tus gráficos, según tus datos y la forma en que configuraste la combinación.

Combinaciones y filtros heredados

Las combinaciones heredan los filtros a nivel del informe, de la página o del grupo, siempre que el filtro sea compatible con los datos anteriores o posteriores a la combinación. Si el filtro es compatible con las fuentes de datos subyacentes que usa la combinación, el filtro actúa sobre los datos combinados previamente. De lo contrario, el filtro actúa sobre los datos después de la combinación. Si el filtro no es compatible con los datos anteriores o posteriores a la combinación, se ignora.

Obtén más información sobre la herencia de filtros.

Cuando un gráfico basado en una combinación está sujeto a un filtro heredado, Looker Studio procesa los datos en cinco pasos:

(Pre-blend):

  • Paso 1: Los datos se agrupan y se agregan en función de las dimensiones que se especifican en el panel Blend Data.
  • Paso 2: Los filtros de dimensiones heredados y los filtros de métricas compatibles se aplican a las fuentes de datos que se incluyen en el panel Combinar datos.

(Combinación):

  • Paso 3: Los datos se combinan con la configuración de unión especificada.

(Pos-fusión):

  • Paso 4: Los datos se agrupan y agregan según las dimensiones del gráfico.
  • Paso 5: Los filtros de métricas, si son compatibles con los datos combinados, se aplican al gráfico.