Tipps und erweiterte Konzepte für das Zusammenführen

In diesem Artikel finden Sie Tipps und ausführliche Informationen zum Zusammenführen von Daten, mit denen Sie die Funktionsweise besser verstehen und komplexe Anwendungsfälle lösen können. Damit Sie diesen Artikel optimal nutzen können, sollten Sie mit den Grundlagen der Datenzusammenführung vertraut sein. Diese werden in den anderen Artikeln in diesem Thema behandelt.

Zusammenführungen sollten nur einen Teil der verfügbaren Daten enthalten

Als Best Practice sollten Sie nur die Felder einfügen, die Sie in auf einer Zusammenführung basierenden Diagrammen visualisieren möchten. Das ist aus folgenden Gründen wichtig:

  • Beim Zusammenführen können sehr große Datensätze entstehen, was die Leistung beeinträchtigen und möglicherweise zu höheren Abfragekosten für kostenpflichtige Dienste wie BigQuery führen kann.
  • In auf Zusammenführungen basierenden Diagrammen werden alle Zeilen berechnet, auch wenn sie im Diagramm nicht verwendet werden.
    • Beispiel: Sie erstellen eine Zusammenführung, die 10 Felder enthält. Anschließend definieren Sie ein Diagramm, in dem nur eines dieser Felder verwendet wird. In Looker Studio wird die aus 10 Feldern bestehende Zusammenführung berechnet und dann wird dieses eine Feld in der Ausgabe der Zusammenführung abgefragt, um das Diagramm zu erstellen.
    • Eine neue Aggregation erfolgt nur, wenn die Zusammenführung eine Teilmenge der zugrundeliegenden Daten enthält.

Messwerte zusammenführen und neu aggregieren

Messwerte, die Sie aus der zugrundeliegenden Datenquelle einschließen, werden in einer Zusammenführung zu nicht aggregierten Zahlen. Wenn die Zusammenführung nicht alle Felder der zugrundeliegenden Datenquelle enthält, werden diese Zahlen auf Grundlage der neuen Daten wieder aggregiert. Das kann nützlich sein, wenn Sie eine andere Aggregation auf ein bereits aggregiertes Feld anwenden möchten, z. B. die Berechnung des Durchschnitts der Durchschnitte.

Weitere Informationen finden Sie unter Daten zusammenführen und neu aggregieren.

Zusammenführungen aus einer einzelnen Datenquelle erstellen

Für Zusammenführungen müssen nicht unbedingt unterschiedliche Datenquellen verwendet werden. Es kann auch nützlich sein, Daten neu zu aggregieren, indem Sie mehrere Tabellen aus derselben Datenquelle zusammenführen.

Angenommen, Sie haben ein Dataset mit Bevölkerungsdaten für die drei größten Landkreise in den bevölkerungsreichsten US-Bundesstaaten, wie in der folgenden Tabelle dargestellt:

Bundesland

Landkreis

Bevölkerung (Schätzung 2023)

Kalifornien

Los Angeles County

10.014.009

Kalifornien

San Diego County

3.298.634

Kalifornien

Orange County

3.186.989

Texas

Harris County

4.731.145

Texas

Dallas County

2.613.539

Texas

Tarrant County

2.110.640

New York

Kings County (Brooklyn)

2.736.074

New York

Queens County

2.405.464

New York

Bronx County

1.418.890

Sie möchten den prozentualen Anteil der Bevölkerung für jeden Landkreis im Bundesstaat berechnen. Dazu ist es jedoch erforderlich, die Gesamtbevölkerung jedes Bundesstaats in einem eigenen Feld anzugeben. Dieser Messwert ist im Datensatz nicht verfügbar. Sie können ihn jedoch erhalten, indem Sie die Datenquelle der Grundgesamtheit mit sich selbst zusammenführen. Gehen Sie dazu so vor:

  1. Erstellen Sie eine Datenquelle mit Ihrem Basisdatensatz.
  2. Fügen Sie einem Bericht ein Diagramm hinzu, das diese Datenquelle verwendet.
  3. Erstellen Sie eine Zusammenführung mit zwei Tabellen. Für jede Tabelle wird dieselbe Datenquelle verwendet, die Sie in Schritt 1 erstellt haben.
    1. Fügen Sie Tabelle 1 die folgenden Felder hinzu:
      1. State, County, Population.
      2. Benennen Sie Population in CountyPopulation um.
    2. Fügen Sie für Tabelle 2 nur das Feld Population ein und benennen Sie es in StatePopulation um.
  4. Verwenden Sie für die Join-Bedingung einen Left Outer Join, um State in Tabelle 1 mit State in Tabelle 2 zu verknüpfen.
  5. Klicken Sie auf Speichern.
  6. Klicken Sie auf X, um zum Berichtseditor zurückzukehren.

Fügen Sie dem Bericht als Nächstes ein neues Diagramm (z. B. eine Tabelle) hinzu und wählen Sie die Zusammenführung als Datenquelle für das Diagramm aus. Gehen Sie dazu so vor:

  1. Fügen Sie dem Diagramm die Felder State, County, CountyPopulation und StatePopulation hinzu.
  2. Um den Prozentsatz der Bevölkerung des Bundesstaats für jeden Landkreis zu berechnen, fügen Sie dem Diagramm ein berechnetes Feld hinzu, das Ihre neuen neu aggregierten Daten verwendet:
    1. Klicken Sie im Eigenschaftenbereich auf Messwert hinzufügen und dann auf Feld hinzufügen.
    2. Geben Sie dem Feld beispielsweise den Namen Prozentsatz der Bevölkerung des Bundesstaats.
    3. Geben Sie im Feld Formel (CountyPopulation / StatePopulation)*100 ein.
    4. Optional: Legen Sie mit dem Anzeigeformat fest, wie genau die Prozentwerte angezeigt werden sollen (z. B. Prozent (2) für zwei Dezimalstellen).

Wenn Sie fertig sind, sollte Ihre Tabelle in etwa so aussehen:

Bundesland

Landkreis

CountyPopulation

StatePopulation

Anteil an der Bevölkerung des Bundesstaats

Kalifornien

Los Angeles County

10014009

16499632

60,69

Texas

Harris County

4731145

9455324

50.04

Kalifornien

San Diego County

3298634

16499632

19,99

Kalifornien

Orange County

3186989

16499632

19,32

New York

Kings County (Brooklyn)

2736074

6560428

41,71

Texas

Dallas County

2613539

9455324

27,64

New York

Queens County

2405464

6560428

36,67

Texas

Tarrant County

2110640

9455324

22.32

New York

Bronx County

1418890

6560428

21.63

Tabellenreihenfolge in der Zusammenführung

In Looker Studio werden die Join-Konfigurationen in der Zusammenführung von links nach rechts ausgewertet. Die Ergebnisse der einzelnen Joins werden dann auf den nächsten Join rechts davon angewendet. Beispiel: Bei einer Zusammenführung aus drei Tabellen wird die Join-Konfiguration zwischen Tabelle 1 (links) und Tabelle 2 (Mitte) ausgewertet. Diese Ergebnisse werden dann für die Join-Konfiguration zwischen Tabelle 2 und Tabelle 3 (rechts) verwendet.

Tabellenreihenfolge in automatisch erstellten Zusammenführungen

Wenn Sie mehrere Diagramme zusammenführen, wird in Looker Studio für jedes Diagramm eine Tabelle erstellt und die Felder im Diagramm werden der entsprechenden Tabelle hinzugefügt. Die Reihenfolge der Tabellen in der Zusammenführung entspricht der Reihenfolge, in der Sie die Diagramme auswählen: Das erste ausgewählte Diagramm wird zur ersten Tabelle (ganz links), das zweite Diagramm zur zweiten Tabelle usw.

In Looker Studio wird außerdem für jede Tabelle automatisch eine Join-Konfiguration erstellt und der Left Outer Join-Typ verwendet.

Falls die Standardkonfiguration nicht Ihren Anforderungen entspricht oder die Verknüpfungen zwischen den Tabellen nicht deutlich erkennbar sind, können Sie die Zusammenführung an Ihre Ziele anpassen.

Tabellen werden vor der Zusammenführung erstellt

Die Daten jeder Tabelle in einer Zusammenführung werden abgefragt, bevor sie in der endgültigen Zusammenführung verknüpft werden. Zeiträume, Filter und berechnete Felder in einer Tabelle werden auf die Abfrage angewendet, mit der die Tabelle generiert wird, bevor Verknüpfungen ausgeführt werden. Diese Faktoren können sich auf die Daten in den Tabellen der Zusammenführung auswirken und die Ausgabe ändern.

Zusammenführungen können mehr Zeilen enthalten als die Originaldaten

Möglicherweise sehen Sie in einem zusammengeführten Diagramm mehr Daten als in den Diagrammen, die auf den einzelnen Datenquellen basieren, aus denen die Zusammenführung besteht. Das Ergebnis kann von Ihren Daten und der für die Zusammenführung auswählten Join-Konfiguration abhängen. Ein Left Outer Join umfasst beispielsweise alle Datensätze aus der linken Tabelle sowie alle Datensätze aus den Tabellen rechts, die in der Join-Bedingung dieselben Werte haben. Falls für die Join-Bedingung mehrere Übereinstimmungen existieren, gibt es in den zusammengeführten Daten eventuell mehr Zeilen als in der Datenquelle links.

Zusammenführungen und explizite Zeiträume und Filter

Die Anzahl der Zeilen in Zusammenführungen lässt sich beschränken, indem Sie einen Zeitraum verwenden oder einen Filter anwenden. Sie können die Zeilen entweder in Diagrammen begrenzen, die auf einer Zusammenführung basieren, oder in den Tabellen, aus denen die Zusammenführung besteht. Der Vorgang findet also entweder vor der Zusammenführung oder nach der Zusammenführung statt.

Wenn Sie einen Zeitraum oder Filter auf eine Tabelle in der Zusammenführung anwenden, wird er wirksam, bevor die Daten mit den anderen Tabellen verknüpft werden. Zeilen, die außerhalb des Zeitraums liegen oder durch den Filter ausgeschlossen werden, sind für die Join-Abfrage nicht verfügbar.

Wenn Sie einen Zeitraum oder Filter auf die Daten in einem Diagramm anwenden, das auf einer Zusammenführung basiert, wird er nach dem Erstellen der Zusammenführung wirksam.

Dieser Unterschied kann einen großen Einfluss auf die Ergebnisse in den Diagrammen haben. Das hängt von Ihren Daten ab und davon, wie Sie die Zusammenführung konfiguriert haben.

Zusammenführungen und übernommene Filter

Für Zusammenführungen werden Filter auf Berichts-, Seiten- oder Gruppenebene übernommen, sofern der Filter mit den Daten vor oder nach der Zusammenführung kompatibel ist. Wenn der Filter mit den zugrundeliegenden Datenquellen kompatibel ist, wird er auf die Daten vor der Zusammenführung angewendet. Andernfalls werden die Daten nach der Zusammenführung gefiltert. Wenn der Filter nicht mit den Daten vor oder nach der Zusammenführung kompatibel ist, wird er nicht berücksichtigt.

Weitere Informationen zum Übernehmen von Filtern

Wenn für ein Diagramm, das auf einer Zusammenführung basiert, ein übernommener Filter gilt, werden die Daten in Looker Studio in fünf Schritten verarbeitet:

(Vor dem Blenden):

  • Schritt 1:Die Daten werden basierend auf den Dimensionen, die im Bereich Daten zusammenführen festgelegt sind, gruppiert und aggregiert.
  • Schritt 2:Übernommene Dimensionsfilter und kompatible Messwertfilter werden auf die Datenquellen im Bereich Daten zusammenführen angewendet.

(Mischen):

  • Schritt 3:Die Daten werden unter Verwendung der angegebenen Join-Konfiguration zusammengeführt.

(Nach der Zusammenführung):

  • Schritt 4:Die Daten werden basierend auf den Dimensionen des Diagramms gruppiert und zusammengefasst.
  • Schritt 5:Messwertfilter werden auf das Diagramm angewendet, wenn sie mit den zusammengeführten Daten kompatibel sind.