In diesem Artikel finden Sie Tipps und ausführliche Informationen zum Zusammenführen von Daten, mit denen Sie die Funktionsweise besser verstehen und komplexe Anwendungsfälle lösen können. Damit Sie diesen Artikel optimal nutzen können, sollten Sie mit den Grundlagen der Datenzusammenführung vertraut sein. Diese werden in den anderen Artikeln in diesem Thema behandelt.
Zusammenführungen sollten nur einen Teil der verfügbaren Daten enthalten
Als Best Practice sollten Sie nur die Felder einfügen, die Sie in auf einer Zusammenführung basierenden Diagrammen visualisieren möchten. Das ist aus folgenden Gründen wichtig:
- Beim Zusammenführen können sehr große Datensätze entstehen, was die Leistung beeinträchtigen und möglicherweise zu höheren Abfragekosten für kostenpflichtige Dienste wie BigQuery führen kann.
- In auf Zusammenführungen basierenden Diagrammen werden alle Zeilen berechnet, auch wenn sie im Diagramm nicht verwendet werden.
- Beispiel: Sie erstellen eine Zusammenführung, die 10 Felder enthält. Anschließend definieren Sie ein Diagramm, in dem nur eines dieser Felder verwendet wird. In Looker Studio wird die aus 10 Feldern bestehende Zusammenführung berechnet und dann wird dieses eine Feld in der Ausgabe der Zusammenführung abgefragt, um das Diagramm zu erstellen.
- Eine neue Aggregation erfolgt nur, wenn die Zusammenführung eine Teilmenge der zugrundeliegenden Daten enthält.
Messwerte zusammenführen und neu aggregieren
Messwerte, die Sie aus der zugrundeliegenden Datenquelle einschließen, werden in einer Zusammenführung zu nicht aggregierten Zahlen. Wenn die Zusammenführung nicht alle Felder der zugrundeliegenden Datenquelle enthält, werden diese Zahlen auf Grundlage der neuen Daten wieder aggregiert. Das kann nützlich sein, wenn Sie eine andere Aggregation auf ein bereits aggregiertes Feld anwenden möchten, z. B. die Berechnung des Durchschnitts der Durchschnitte.
Weitere Informationen finden Sie unter Daten zusammenführen und neu aggregieren.
Zusammenführungen aus einer einzelnen Datenquelle erstellen
Für Zusammenführungen müssen nicht unbedingt unterschiedliche Datenquellen verwendet werden. Es kann auch nützlich sein, Daten neu zu aggregieren, indem Sie mehrere Tabellen aus derselben Datenquelle zusammenführen.
Angenommen, Sie haben ein Dataset mit Bevölkerungsdaten für die drei größten Landkreise in den bevölkerungsreichsten US-Bundesstaaten, wie in der folgenden Tabelle dargestellt:
Bundesland |
Landkreis |
Bevölkerung (Schätzung 2023) |
---|---|---|
Kalifornien |
Los Angeles County |
10.014.009 |
Kalifornien |
San Diego County |
3.298.634 |
Kalifornien |
Orange County |
3.186.989 |
Texas |
Harris County |
4.731.145 |
Texas |
Dallas County |
2.613.539 |
Texas |
Tarrant County |
2.110.640 |
New York |
Kings County (Brooklyn) |
2.736.074 |
New York |
Queens County |
2.405.464 |
New York |
Bronx County |
1.418.890 |
Sie möchten den prozentualen Anteil der Bevölkerung für jeden Landkreis im Bundesstaat berechnen. Dazu ist es jedoch erforderlich, die Gesamtbevölkerung jedes Bundesstaats in einem eigenen Feld anzugeben. Dieser Messwert ist im Datensatz nicht verfügbar. Sie können ihn jedoch erhalten, indem Sie die Datenquelle der Grundgesamtheit mit sich selbst zusammenführen. Gehen Sie dazu so vor:
- Erstellen Sie eine Datenquelle mit Ihrem Basisdatensatz.
- Fügen Sie einem Bericht ein Diagramm hinzu, das diese Datenquelle verwendet.
- Erstellen Sie eine Zusammenführung mit zwei Tabellen. Für jede Tabelle wird dieselbe Datenquelle verwendet, die Sie in Schritt 1 erstellt haben.
- Fügen Sie Tabelle 1 die folgenden Felder hinzu:
- State, County, Population.
- Benennen Sie Population in CountyPopulation um.
- Fügen Sie für Tabelle 2 nur das Feld Population ein und benennen Sie es in StatePopulation um.
- Fügen Sie Tabelle 1 die folgenden Felder hinzu:
- Verwenden Sie für die Join-Bedingung einen Left Outer Join, um State in Tabelle 1 mit State in Tabelle 2 zu verknüpfen.
- Klicken Sie auf Speichern.
- Klicken Sie auf X, um zum Berichtseditor zurückzukehren.
Fügen Sie dem Bericht als Nächstes ein neues Diagramm (z. B. eine Tabelle) hinzu und wählen Sie die Zusammenführung als Datenquelle für das Diagramm aus. Gehen Sie dazu so vor:
- Fügen Sie dem Diagramm die Felder State, County, CountyPopulation und StatePopulation hinzu.
- Um den Prozentsatz der Bevölkerung des Bundesstaats für jeden Landkreis zu berechnen, fügen Sie dem Diagramm ein berechnetes Feld hinzu, das Ihre neuen neu aggregierten Daten verwendet:
- Klicken Sie im Eigenschaftenbereich auf Messwert hinzufügen und dann auf Feld hinzufügen.
- Geben Sie dem Feld beispielsweise den Namen Prozentsatz der Bevölkerung des Bundesstaats.
- Geben Sie im Feld Formel
(CountyPopulation / StatePopulation)*100
ein. - Optional: Legen Sie mit dem Anzeigeformat fest, wie genau die Prozentwerte angezeigt werden sollen (z. B. Prozent (2) für zwei Dezimalstellen).
Wenn Sie fertig sind, sollte Ihre Tabelle in etwa so aussehen:
Bundesland |
Landkreis |
CountyPopulation |
StatePopulation |
Anteil an der Bevölkerung des Bundesstaats |
---|---|---|---|---|
Kalifornien |
Los Angeles County |
10014009 |
16499632 |
60,69 |
Texas |
Harris County |
4731145 |
9455324 |
50.04 |
Kalifornien |
San Diego County |
3298634 |
16499632 |
19,99 |
Kalifornien |
Orange County |
3186989 |
16499632 |
19,32 |
New York |
Kings County (Brooklyn) |
2736074 |
6560428 |
41,71 |
Texas |
Dallas County |
2613539 |
9455324 |
27,64 |
New York |
Queens County |
2405464 |
6560428 |
36,67 |
Texas |
Tarrant County |
2110640 |
9455324 |
22.32 |
New York |
Bronx County |
1418890 |
6560428 |
21.63 |
Tabellenreihenfolge in der Zusammenführung
In Looker Studio werden die Join-Konfigurationen in der Zusammenführung von links nach rechts ausgewertet. Die Ergebnisse der einzelnen Joins werden dann auf den nächsten Join rechts davon angewendet. Beispiel: Bei einer Zusammenführung aus drei Tabellen wird die Join-Konfiguration zwischen Tabelle 1 (links) und Tabelle 2 (Mitte) ausgewertet. Diese Ergebnisse werden dann für die Join-Konfiguration zwischen Tabelle 2 und Tabelle 3 (rechts) verwendet.
Tabellenreihenfolge in automatisch erstellten Zusammenführungen
Wenn Sie mehrere Diagramme zusammenführen, wird in Looker Studio für jedes Diagramm eine Tabelle erstellt und die Felder im Diagramm werden der entsprechenden Tabelle hinzugefügt. Die Reihenfolge der Tabellen in der Zusammenführung entspricht der Reihenfolge, in der Sie die Diagramme auswählen: Das erste ausgewählte Diagramm wird zur ersten Tabelle (ganz links), das zweite Diagramm zur zweiten Tabelle usw.
In Looker Studio wird außerdem für jede Tabelle automatisch eine Join-Konfiguration erstellt und der Left Outer Join-Typ verwendet.
Falls die Standardkonfiguration nicht Ihren Anforderungen entspricht oder die Verknüpfungen zwischen den Tabellen nicht deutlich erkennbar sind, können Sie die Zusammenführung an Ihre Ziele anpassen.
Tabellen werden vor der Zusammenführung erstellt
Die Daten jeder Tabelle in einer Zusammenführung werden abgefragt, bevor sie in der endgültigen Zusammenführung verknüpft werden. Zeiträume, Filter und berechnete Felder in einer Tabelle werden auf die Abfrage angewendet, mit der die Tabelle generiert wird, bevor Verknüpfungen ausgeführt werden. Diese Faktoren können sich auf die Daten in den Tabellen der Zusammenführung auswirken und die Ausgabe ändern.
Zusammenführungen können mehr Zeilen enthalten als die Originaldaten
Möglicherweise sehen Sie in einem zusammengeführten Diagramm mehr Daten als in den Diagrammen, die auf den einzelnen Datenquellen basieren, aus denen die Zusammenführung besteht. Das Ergebnis kann von Ihren Daten und der für die Zusammenführung auswählten Join-Konfiguration abhängen. Ein Left Outer Join umfasst beispielsweise alle Datensätze aus der linken Tabelle sowie alle Datensätze aus den Tabellen rechts, die in der Join-Bedingung dieselben Werte haben. Falls für die Join-Bedingung mehrere Übereinstimmungen existieren, gibt es in den zusammengeführten Daten eventuell mehr Zeilen als in der Datenquelle links.
Zusammenführungen und explizite Zeiträume und Filter
Die Anzahl der Zeilen in Zusammenführungen lässt sich beschränken, indem Sie einen Zeitraum verwenden oder einen Filter anwenden. Sie können die Zeilen entweder in Diagrammen begrenzen, die auf einer Zusammenführung basieren, oder in den Tabellen, aus denen die Zusammenführung besteht. Der Vorgang findet also entweder vor der Zusammenführung oder nach der Zusammenführung statt.
Wenn Sie einen Zeitraum oder Filter auf eine Tabelle in der Zusammenführung anwenden, wird er wirksam, bevor die Daten mit den anderen Tabellen verknüpft werden. Zeilen, die außerhalb des Zeitraums liegen oder durch den Filter ausgeschlossen werden, sind für die Join-Abfrage nicht verfügbar.
Wenn Sie einen Zeitraum oder Filter auf die Daten in einem Diagramm anwenden, das auf einer Zusammenführung basiert, wird er nach dem Erstellen der Zusammenführung wirksam.
Dieser Unterschied kann einen großen Einfluss auf die Ergebnisse in den Diagrammen haben. Das hängt von Ihren Daten ab und davon, wie Sie die Zusammenführung konfiguriert haben.
Zusammenführungen und übernommene Filter
Für Zusammenführungen werden Filter auf Berichts-, Seiten- oder Gruppenebene übernommen, sofern der Filter mit den Daten vor oder nach der Zusammenführung kompatibel ist. Wenn der Filter mit den zugrundeliegenden Datenquellen kompatibel ist, wird er auf die Daten vor der Zusammenführung angewendet. Andernfalls werden die Daten nach der Zusammenführung gefiltert. Wenn der Filter nicht mit den Daten vor oder nach der Zusammenführung kompatibel ist, wird er nicht berücksichtigt.
Weitere Informationen zum Übernehmen von Filtern
Wenn für ein Diagramm, das auf einer Zusammenführung basiert, ein übernommener Filter gilt, werden die Daten in Looker Studio in fünf Schritten verarbeitet:
(Vor dem Blenden):
- Schritt 1:Die Daten werden basierend auf den Dimensionen, die im Bereich Daten zusammenführen festgelegt sind, gruppiert und aggregiert.
- Schritt 2:Übernommene Dimensionsfilter und kompatible Messwertfilter werden auf die Datenquellen im Bereich Daten zusammenführen angewendet.
(Mischen):
- Schritt 3:Die Daten werden unter Verwendung der angegebenen Join-Konfiguration zusammengeführt.
(Nach der Zusammenführung):
- Schritt 4:Die Daten werden basierend auf den Dimensionen des Diagramms gruppiert und zusammengefasst.
- Schritt 5:Messwertfilter werden auf das Diagramm angewendet, wenn sie mit den zusammengeführten Daten kompatibel sind.
Weitere Informationen
- Probleme beim Zusammenführen (Tipps zur Fehlerbehebung)
- Aggregation