Cet article fournit des conseils et des informations détaillées sur la combinaison de données pour vous aider à comprendre son fonctionnement et à résoudre des cas d'utilisation complexes. Pour tirer le meilleur parti de cet article, vous devez déjà connaître les principes de base de la fusion de données, qui sont abordés dans les autres articles de cette section.
Les combinaisons ne doivent contenir qu'un sous-ensemble des données disponibles
Il est recommandé de n'inclure que les champs spécifiques que vous souhaitez visualiser dans des graphiques basés sur une combinaison. Voici pourquoi c'est important:
- La combinaison peut créer des ensembles de données très volumineux, ce qui peut ralentir les performances et potentiellement augmenter les coûts des requêtes pour les services payants tels que BigQuery.
- Les graphiques basés sur des combinaisons calculent toutes les lignes incluses dans la combinaison, même si elles ne sont pas utilisées dans le graphique.
- Supposons que vous créez une combinaison contenant 10 champs. Vous configurez ensuite un graphique qui n'utilise qu'un seul de ces champs. Looker Studio calcule la combinaison des 10 champs, puis interroge cet unique champ dans le résultat de la combinaison pour créer le graphique.
- Une réagrégation ne se produit que si la combinaison contient un sous-ensemble des données sous-jacentes.
Combiner des métriques pour les réagréger
Les métriques que vous incluez à partir de la source de données sous-jacente deviennent des nombres non agrégés dans une combinaison. Lorsque la combinaison n'inclut pas l'ensemble entier des champs de la source de données sous-jacente, ces nombres sont réagrégés sur la base des nouvelles données. Cette utilisation de la combinaison peut être utile si vous devez appliquer une agrégation différente à un champ déjà agrégé, par exemple pour calculer une moyenne de moyennes.
Pour en savoir plus, consultez Combiner des données pour les réagréger.
Créer des combinaisons à partir d'une seule source de données
Les combinaisons n'ont pas besoin d'utiliser différentes sources de données. Vous pouvez également trouver utile de réagréger des données en combinant plusieurs tableaux issus de la même source de données.
Par exemple, supposons que vous disposiez d'un ensemble de données contenant des données démographiques sur les trois comtés les plus peuplés des États américains les plus peuplés, comme indiqué dans le tableau suivant:
État |
Comté |
Population (estimation 2023) |
---|---|---|
Californie |
Comté de Los Angeles |
10 014 009 |
Californie |
Comté de San Diego |
3 298 634 |
Californie |
Orange County |
3 186 989 |
Texas |
Comté de Harris |
4 731 145 |
Texas |
Comté de Dallas |
2 613 539 |
Texas |
Comté de Tarrant |
2 110 640 |
New York |
Comté de Kings (Brooklyn) |
2 736 074 |
New York |
Queens |
2 405 464 |
New York |
Comté de Bronx |
1 418 890 |
Vous souhaitez calculer le pourcentage de population pour chaque comté de l'État. Pour ce faire, vous devez définir la population totale de chaque État en tant que champ distinct. Dans l'ensemble de données, cette métrique n'est pas disponible. Vous pouvez toutefois l'obtenir en fusionnant votre source de données sur la population avec elle-même en procédant comme suit:
- Créez une source de données à l'aide de votre ensemble de données de base.
- Ajoutez un graphique qui utilise cette source de données à un rapport.
- Créez un mélange avec deux tables. Chaque table utilisera la même source de données que celle que vous avez créée à l'étape 1.
- Pour le tableau 1, incluez les champs suivants :
- État, Comté, Population
- Renommez Population en CountyPopulation.
- Pour le tableau 2, il vous suffit d'inclure le champ Population et de le renommer StatePopulation.
- Pour le tableau 1, incluez les champs suivants :
- Pour la condition de jointure, utilisez une jointure externe gauche, en associant État dans le tableau 1 à État dans le tableau 2.
- Cliquez sur Enregistrer.
- Revenez à l'éditeur de rapports en cliquant sur X.
Ajoutez ensuite un graphique (par exemple, un tableau) à votre rapport et sélectionnez le mélange comme source de données du graphique en procédant comme suit:
- Ajoutez les champs État, Comté, Population du comté et Population de l'État au graphique.
- Pour calculer le pourcentage de la population de l'État pour chaque comté, ajoutez un champ calculé au graphique qui utilise vos nouvelles données réagrégées :
- Dans le panneau des propriétés, cliquez sur Ajouter une métrique,puis sur Ajouter un champ.
- Attribuez un nom au champ (par exemple, Pourcentage de la population de l'État).
- Dans la zone Formule, saisissez
(CountyPopulation / StatePopulation)*100
. - (Facultatif) Définissez l'option Format d'affichage pour afficher les valeurs de pourcentage au niveau souhaité (par exemple, Pourcentage (2) pour deux chiffres après la virgule).
Lorsque vous avez terminé, votre tableau doit se présenter comme suit:
État |
Comté |
CountyPopulation |
StatePopulation |
Pourcentage de la population de l'État |
---|---|---|---|---|
Californie |
Comté de Los Angeles |
10014009 |
16499632 |
60,69 |
Texas |
Comté de Harris |
4731145 |
9455324 |
50.04 |
Californie |
Comté de San Diego |
3298634 |
16499632 |
19,99 |
Californie |
Orange County |
3186989 |
16499632 |
19,32 |
New York |
Comté de Kings (Brooklyn) |
2736074 |
6560428 |
41,71 |
Texas |
Comté de Dallas |
2613539 |
9455324 |
27,64 |
New York |
Queens |
2405464 |
6560428 |
36,67 |
Texas |
Comté de Tarrant |
2110640 |
9455324 |
22,32 |
New York |
Comté de Bronx |
1418890 |
6560428 |
21,63 |
Ordre des tables dans la combinaison
Looker Studio évalue les configurations des jointures dans l'ordre, en commençant par la configuration la plus à gauche. Les résultats de chaque jointure sont ensuite appliqués à celle qui se trouve juste à sa droite. Par exemple, dans une combinaison de trois tables, la configuration de jointure entre la table 1 (la plus à gauche) et la table 2 (celle du milieu) est évaluée, puis les résultats sont utilisés par la configuration de jointure entre la table 2 et la table 3 (la plus à droite).
Ordre des tables dans les combinaisons créées automatiquement
Lorsque vous combinez une sélection de graphiques, Looker Studio crée une table pour chaque graphique, puis ajoute les champs du graphique à la table correspondante. L'ordre des tables dans la combinaison correspond à celui dans lequel vous sélectionnez les graphiques: le premier graphique sélectionné devient la première table (la plus à gauche), le deuxième graphique devient la deuxième table, etc.
Looker Studio crée aussi automatiquement une configuration de jointure pour chaque table et utilise le type de jointure externe gauche.
Si la configuration par défaut ne vous convient pas ou s'il n'y a pas de liaisons claires entre les tables, vous pouvez modifier la combinaison selon vos besoins.
Les tables sont créées avant la combinaison
Les données de chaque table dans une combinaison sont interrogées avant d'être jointes à la combinaison finale. Les plages de dates, les filtres et les champs calculés dans une table sont appliqués à la requête générant la table avant que les jointures soient effectuées. Ces facteurs peuvent affecter les données incluses dans les tables de la combinaison et modifier le résultat de la combinaison.
Les combinaisons peuvent contenir davantage de lignes que les données d'origine
Il peut arriver qu'il y ait davantage de données dans un graphique combiné que dans les graphiques basés sur les différentes sources de données qui forment la combinaison. Le résultat peut dépendre de vos données et de la configuration de jointure choisie pour la combinaison. Par exemple, une jointure externe gauche inclut tous les enregistrements de la table de gauche, ainsi que tous les enregistrements des tables à sa droite qui partagent les mêmes valeurs dans la condition de jointure. Lorsque la condition de jointure a plusieurs correspondances, cela peut avoir pour effet de générer plus de lignes dans les données combinées que celles qui se trouvent dans la source de données la plus à gauche.
Combinaisons, et plages de dates et filtres explicites
Pour limiter le nombre de lignes dans les combinaisons, vous pouvez soit utiliser une plage de dates, soit appliquer un filtre. Vous pouvez limiter les lignes dans les graphiques basés sur une combinaison ou dans les tables qui la composent. Il est utile de considérer le processus comme étant "précombinaison" ou "post-combinaison".
Lorsque vous appliquez une plage de dates ou un filtre à une table dans la combinaison, l'opération prend effet avant que les données ne soient jointes aux autres tables de la combinaison ("précombinaison"). Les lignes qui sont en dehors de la plage de dates ou qui sont exclues par le filtre ne sont pas prises en compte dans la requête de jointure.
Lorsque vous appliquez une plage de dates ou un filtre à un graphique basé sur une combinaison, vous l'appliquez aux données après que la combinaison a été créée ("post-combinaison").
Cette différence peut beaucoup influer sur les résultats présentés dans vos graphiques, en fonction de vos données et de la façon dont vous avez configuré la combinaison.
Combinaisons et filtres hérités
Les combinaisons héritent des filtres au niveau du rapport, de la page ou du groupe, à condition que le filtre soit compatible avec les données précombinées ou postcombinées. Si le filtre est compatible avec la ou les sources de données sous-jacentes utilisées par la combinaison, il agit sur les données précombinées. Sinon, il agit sur les données post-combinées. Si le filtre n'est compatible ni avec les données précombinées, ni avec les données postcombinées, il est ignoré.
En savoir plus sur l'héritage des filtres
Lorsqu'un graphique basé sur une combinaison est soumis à un filtre hérité, Looker Studio traite les données en cinq étapes:
(Pré-mélange):
- Étape 1:Les données sont regroupées et agrégées en fonction des dimensions spécifiées dans le panneau Combiner les données.
- Étape 2:Les filtres de dimensions hérités et les filtres de métriques compatibles sont appliqués aux sources de données incluses dans le panneau Combiner les données.
(Mélange):
- Étape 3:Les données sont combinées à l'aide de la configuration de jointure spécifiée.
(Après mélange):
- Étape 4:Les données sont regroupées et agrégées en fonction des dimensions du graphique.
- Étape 5:S'ils sont compatibles avec les données combinées, les filtres de métriques sont appliqués au graphique.