Notez que vous consultez la documentation de Looker. Pour accéder à la documentation Looker Studio, consultez https://support.google.com/looker-studio.

Cette page a été traduite par l'API Cloud Translation.

Conseils et concepts avancés sur la combinaison

Cet article fournit des conseils et des informations détaillées sur la combinaison de données pour vous aider à comprendre son fonctionnement et à résoudre des cas d'utilisation complexes. Pour tirer le meilleur parti de cet article, vous devez déjà connaître les principes de base de la fusion de données, qui sont abordés dans les autres articles de cette section.

Les combinaisons ne doivent contenir qu'un sous-ensemble des données disponibles

Il est recommandé de n'inclure que les champs spécifiques que vous souhaitez visualiser dans des graphiques basés sur une combinaison. Voici pourquoi c'est important:

La combinaison peut créer des ensembles de données très volumineux, ce qui peut ralentir les performances et potentiellement augmenter les coûts des requêtes pour les services payants tels que BigQuery.
Les graphiques basés sur des combinaisons calculent toutes les lignes incluses dans la combinaison, même si elles ne sont pas utilisées dans le graphique.
- Supposons que vous créez une combinaison contenant 10 champs. Vous configurez ensuite un graphique qui n'utilise qu'un seul de ces champs. Looker Studio calcule la combinaison des 10 champs, puis interroge cet unique champ dans le résultat de la combinaison pour créer le graphique.
- Une réagrégation ne se produit que si la combinaison contient un sous-ensemble des données sous-jacentes.

Combiner des métriques pour les réagréger

Les métriques que vous incluez à partir de la source de données sous-jacente deviennent des nombres non agrégés dans une combinaison. Lorsque la combinaison n'inclut pas l'ensemble entier des champs de la source de données sous-jacente, ces nombres sont réagrégés sur la base des nouvelles données. Cette utilisation de la combinaison peut être utile si vous devez appliquer une agrégation différente à un champ déjà agrégé, par exemple pour calculer une moyenne de moyennes.

Pour en savoir plus, consultez Combiner des données pour les réagréger.

Créer des combinaisons à partir d'une seule source de données

Les combinaisons n'ont pas besoin d'utiliser différentes sources de données. Vous pouvez également trouver utile de réagréger des données en combinant plusieurs tableaux issus de la même source de données.

Par exemple, supposons que vous disposiez d'un ensemble de données contenant des données démographiques sur les trois comtés les plus peuplés des États américains les plus peuplés, comme indiqué dans le tableau suivant:

État	Comté	Population (estimation 2023)
Californie	Comté de Los Angeles	10 014 009
Californie	Comté de San Diego	3 298 634
Californie	Orange County	3 186 989
Texas	Comté de Harris	4 731 145
Texas	Comté de Dallas	2 613 539
Texas	Comté de Tarrant	2 110 640
New York	Comté de Kings (Brooklyn)	2 736 074
New York	Queens	2 405 464
New York	Comté de Bronx	1 418 890

Vous souhaitez calculer le pourcentage de population pour chaque comté de l'État. Pour ce faire, vous devez définir la population totale de chaque État en tant que champ distinct. Dans l'ensemble de données, cette métrique n'est pas disponible. Vous pouvez toutefois l'obtenir en fusionnant votre source de données sur la population avec elle-même en procédant comme suit:

Créez une source de données à l'aide de votre ensemble de données de base.
Ajoutez un graphique qui utilise cette source de données à un rapport.
Créez un mélange avec deux tables. Chaque table utilisera la même source de données que celle que vous avez créée à l'étape 1.
1. Pour le tableau 1, incluez les champs suivants :
  1. État, Comté, Population
  2. Renommez Population en CountyPopulation.
2. Pour le tableau 2, il vous suffit d'inclure le champ Population et de le renommer StatePopulation.
Pour la condition de jointure, utilisez une jointure externe gauche, en associant État dans le tableau 1 à État dans le tableau 2.
Cliquez sur Enregistrer.
Revenez à l'éditeur de rapports en cliquant sur X.

Ajoutez ensuite un graphique (par exemple, un tableau) à votre rapport et sélectionnez le mélange comme source de données du graphique en procédant comme suit:

Ajoutez les champs État, Comté, Population du comté et Population de l'État au graphique.
Pour calculer le pourcentage de la population de l'État pour chaque comté, ajoutez un champ calculé au graphique qui utilise vos nouvelles données réagrégées :
1. Dans le panneau des propriétés, cliquez sur Ajouter une métrique,puis sur Ajouter un champ.
2. Attribuez un nom au champ (par exemple, Pourcentage de la population de l'État).
3. Dans la zone Formule, saisissez (CountyPopulation / StatePopulation)*100.
4. (Facultatif) Définissez l'option Format d'affichage pour afficher les valeurs de pourcentage au niveau souhaité (par exemple, Pourcentage (2) pour deux chiffres après la virgule).

Lorsque vous avez terminé, votre tableau doit se présenter comme suit:

État	Comté	CountyPopulation	StatePopulation	Pourcentage de la population de l'État
Californie	Comté de Los Angeles	10014009	16499632	60,69
Texas	Comté de Harris	4731145	9455324	50.04
Californie	Comté de San Diego	3298634	16499632	19,99
Californie	Orange County	3186989	16499632	19,32
New York	Comté de Kings (Brooklyn)	2736074	6560428	41,71
Texas	Comté de Dallas	2613539	9455324	27,64
New York	Queens	2405464	6560428	36,67
Texas	Comté de Tarrant	2110640	9455324	22,32
New York	Comté de Bronx	1418890	6560428	21,63

Ordre des tables dans la combinaison

Looker Studio évalue les configurations des jointures dans l'ordre, en commençant par la configuration la plus à gauche. Les résultats de chaque jointure sont ensuite appliqués à celle qui se trouve juste à sa droite. Par exemple, dans une combinaison de trois tables, la configuration de jointure entre la table 1 (la plus à gauche) et la table 2 (celle du milieu) est évaluée, puis les résultats sont utilisés par la configuration de jointure entre la table 2 et la table 3 (la plus à droite).

Ordre des tables dans les combinaisons créées automatiquement

Lorsque vous combinez une sélection de graphiques, Looker Studio crée une table pour chaque graphique, puis ajoute les champs du graphique à la table correspondante. L'ordre des tables dans la combinaison correspond à celui dans lequel vous sélectionnez les graphiques: le premier graphique sélectionné devient la première table (la plus à gauche), le deuxième graphique devient la deuxième table, etc.

Looker Studio crée aussi automatiquement une configuration de jointure pour chaque table et utilise le type de jointure externe gauche.

Si la configuration par défaut ne vous convient pas ou s'il n'y a pas de liaisons claires entre les tables, vous pouvez modifier la combinaison selon vos besoins.

Les tables sont créées avant la combinaison

Les données de chaque table dans une combinaison sont interrogées avant d'être jointes à la combinaison finale. Les plages de dates, les filtres et les champs calculés dans une table sont appliqués à la requête générant la table avant que les jointures soient effectuées. Ces facteurs peuvent affecter les données incluses dans les tables de la combinaison et modifier le résultat de la combinaison.

Les combinaisons peuvent contenir davantage de lignes que les données d'origine

Il peut arriver qu'il y ait davantage de données dans un graphique combiné que dans les graphiques basés sur les différentes sources de données qui forment la combinaison. Le résultat peut dépendre de vos données et de la configuration de jointure choisie pour la combinaison. Par exemple, une jointure externe gauche inclut tous les enregistrements de la table de gauche, ainsi que tous les enregistrements des tables à sa droite qui partagent les mêmes valeurs dans la condition de jointure. Lorsque la condition de jointure a plusieurs correspondances, cela peut avoir pour effet de générer plus de lignes dans les données combinées que celles qui se trouvent dans la source de données la plus à gauche.

Combinaisons, et plages de dates et filtres explicites

Pour limiter le nombre de lignes dans les combinaisons, vous pouvez soit utiliser une plage de dates, soit appliquer un filtre. Vous pouvez limiter les lignes dans les graphiques basés sur une combinaison ou dans les tables qui la composent. Il est utile de considérer le processus comme étant "précombinaison" ou "post-combinaison".

Lorsque vous appliquez une plage de dates ou un filtre à une table dans la combinaison, l'opération prend effet avant que les données ne soient jointes aux autres tables de la combinaison ("précombinaison"). Les lignes qui sont en dehors de la plage de dates ou qui sont exclues par le filtre ne sont pas prises en compte dans la requête de jointure.

Lorsque vous appliquez une plage de dates ou un filtre à un graphique basé sur une combinaison, vous l'appliquez aux données après que la combinaison a été créée ("post-combinaison").

Cette différence peut beaucoup influer sur les résultats présentés dans vos graphiques, en fonction de vos données et de la façon dont vous avez configuré la combinaison.

Combinaisons et filtres hérités

Les combinaisons héritent des filtres au niveau du rapport, de la page ou du groupe, à condition que le filtre soit compatible avec les données précombinées ou postcombinées. Si le filtre est compatible avec la ou les sources de données sous-jacentes utilisées par la combinaison, il agit sur les données précombinées. Sinon, il agit sur les données post-combinées. Si le filtre n'est compatible ni avec les données précombinées, ni avec les données postcombinées, il est ignoré.

En savoir plus sur l'héritage des filtres

Lorsqu'un graphique basé sur une combinaison est soumis à un filtre hérité, Looker Studio traite les données en cinq étapes:

(Pré-mélange):

Étape 1:Les données sont regroupées et agrégées en fonction des dimensions spécifiées dans le panneau Combiner les données.
Étape 2:Les filtres de dimensions hérités et les filtres de métriques compatibles sont appliqués aux sources de données incluses dans le panneau Combiner les données.

(Mélange):

Étape 3:Les données sont combinées à l'aide de la configuration de jointure spécifiée.

(Après mélange):

Étape 4:Les données sont regroupées et agrégées en fonction des dimensions du graphique.
Étape 5:S'ils sont compatibles avec les données combinées, les filtres de métriques sont appliqués au graphique.