Integration mit Google Analytics 4

Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus Google Analytics 4 (GA4) als Datenquelle für die Marketing-Arbeitslast der Cortex Framework Data Foundation zu verwenden.

GA4 ist die neueste Version von Google Analytics. Sie bietet einen ganzheitlichen Überblick über das Nutzerverhalten und konzentriert sich dabei auf ereignisbasiertes Tracking und maschinelles Lernen, um detailliertere Informationen zu liefern. Mit Cortex Framework können Sie Daten aus GA4 extrahieren und in BigQuery für weitere Analysen und Berichte einbinden. So können Sie wertvolle Erkenntnisse gewinnen und bessere Geschäftsergebnisse erzielen.

Das folgende Diagramm zeigt, wie GA4-Daten über die Marketing-Arbeitslast von Cortex Framework Data Foundation verfügbar sind:

GA4-Datenquelle

Abbildung 1. GA4-Datenquelle

Konfigurationsdatei

In der Datei config.json werden die Einstellungen konfiguriert, die für die Verbindung zu Datenquellen zur Übertragung von Daten aus verschiedenen Arbeitslasten erforderlich sind. Diese Datei enthält die folgenden Parameter für GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:

Parameter Bedeutung Standardwert Beschreibung
marketing.deployGA4 GA4 implementieren true Führen Sie die Bereitstellung für die GA4-Datenquelle aus.
marketing.GA4.datasets.cdc BigQuery Export-Datasets für GA4 [{"property_id": 0, "name": ""}] Array von Google Analytics 4-BigQuery-Exportdatensätzen Für jedes Element wird Property ID als INT und der entsprechende Name des BigQuery-Export-Datasets angegeben.
marketing.GA4.datasets.reporting Datensatz für die Berichterstellung in GA4 REPORTING_GA4 Datensatz für die Berichterstellung in GA4.

Datenmodell

In diesem Abschnitt wird das GA4-Datenmodell anhand eines Entitätsbeziehungsdiagramms (ERD) beschrieben.

Entitätsbeziehungsdiagramm für GA4

Abbildung 2 GA4: Entitätsbeziehungsdiagramm.

Basisansichten

Dies sind die blauen Objekte in der ERD und sind Ansichten auf CDC-Tabellen mit minimalen Transformationen, um komplexe Datenstrukturen zu entpacken. Scripts in src/marketing/src/GA4/src/reporting/ddls ansehen

Berichtsdatenansichten

Dies sind die grünen Objekte in der ERD und Berichtsansichten, die zusammengefasste Messwerte enthalten. Scripts in src/marketing/src/GA4/src/reporting/ddls ansehen

Integration für GA4 konfigurieren

Die Cortex Framework Data Foundation lässt sich in GA4 einbinden, indem eine Berichtsebene auf den BigQuery Export-Datasets von GA4 erstellt wird. Diese werden in der Cortex Framework-Architektur als CDC-Datasets behandelt. Dazu werden je nach Konfiguration der Berichtseinstellungen Laufzeitansichten auf CDC-Tabellen erstellt oder Cloud Composer-DAGs für materialisierte Daten in BigQuery-Tabellen ausgeführt.

GA4 BigQuery Export einrichten

Das Cortex-Framework verwendet die BigQuery Export-Funktion von GA4, um Daten aus dem Quellsystem in BigQuery zu laden. Folgen Sie der Anleitung zum Einrichten von BigQuery Export oder der Anleitung für jede GA4-Property in diesem GA4-Hilfeartikel: GA4 – BigQuery Export einrichten.

Bekannte Probleme, Einschränkungen und weitere Aspekte

Beachten Sie beim Einrichten von GA4 BigQuery Export Folgendes:

  • Backfilling: Der GA4 BigQuery Export beginnt am Tag der Einrichtung und es erfolgt kein Backfilling.
  • Abweichungen zwischen den in der GA4-Benutzeroberfläche und im Cortex-Framework angegebenen Zahlen: Mehrere Faktoren, darunter Stichprobenerhebung, Verzögerungen bei der Datenerhebung und Berichte mit hoher Kardinalität, können zu geringfügigen Abweichungen zwischen der Google Analytics-Benutzeroberfläche und dem Cortex-Framework führen. Dies ist eine bekannte und inhärente Einschränkung von Google Analytics. Weitere Informationen finden Sie unter Die Lücke zwischen Google Analytics-UI und BigQuery-Export schließen .
  • Einschränkungen beim Volumen des Ereignisexports: Je nach Google Analytics-Version gelten für den täglichen BigQuery-Export möglicherweise Einschränkungen. Weitere Informationen finden Sie unter GA4 – BigQuery Export einrichten.
  • Zeitzone: In BigQuery Export wird event_date in der Berichtszeitzone der Property festgelegt. event_timestamp ist der UTC-Zeitstempel in Mikrosekunden. Wenn event_timestamp verwendet wird, müssen Sie beim Vergleich mit den Zahlen in der Benutzeroberfläche die richtige Zeitzone für die Berichte berücksichtigen.
  • Täglicher Export von Ereignissen im Vergleich zu Streaming-Exporten (Echtzeit): Für Ereignis-Exporte unterstützt das Cortex-Framework nur die events_YYYYMMDD-Tabellen, die durch den vollständigen täglichen Export erstellt wurden. Weitere Informationen finden Sie unter GA4 – BigQuery Export.
  • GA4 360-Service Level Agreement (SLA) für BigQuery Export: Das Cortex-Framework unterstützt die events_fresh_-Tabellen, die durch tagesaktuelle Exporte erstellt wurden, nicht als separate Quelltabellen. Sie können jedoch den ##CORTEX-CUSTOMER-Anpassungskommentaren in der Events-Berichtsansicht folgen, um die Quelltabellen durch diese zu ersetzen und so das SLA für diese Funktion zu nutzen. Alle Berichtsansichten funktionieren nach der Umstellung weiterhin.

Datenaktualität und Verzögerung

Im Allgemeinen ist die Datenaktualität für Cortex Framework-Datenquellen durch die Möglichkeiten der Upstream-Verbindung und die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Ausführungshäufigkeit des DAG an die Upstream-Frequenz, die Ressourcenbeschränkungen und Ihre Geschäftsanforderungen an.

In Google Analytics 4 können sich die Daten im BigQuery-Export je nach Zeitzone um bis zu einen Tag verzögern, es sei denn, Sie verwenden den tagesaktuellen Export.

Konfigurationen

In diesem Abschnitt werden die Konfigurationen für den Datenablauf beschrieben.

Cloud Composer-Verbindungen

Erstellen Sie die folgenden Verbindungen in Cloud Composer. Weitere Informationen finden Sie in der Dokumentation zum Verwalten von Airflow-Verbindungen.

Verbindungsname Purpose
dv360_cdc_bq Für die Übertragung von Rohdatensätzen > CDC-Datensätzen.
dv360_reporting_bq Für CDC-Dataset > Berichtsdatensatzübertragung

Berichtseinstellungen

Mit der Datei „Berichtseinstellungen“ src/GA4/config/reporting_settings.yaml können Sie konfigurieren und steuern, wie das Cortex Framework Daten für die GA4-Berichtsebene generiert. In dieser Datei wird festgelegt, wie BigQuery-Objekte der Berichtsebene (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) generiert werden.

Weitere Informationen finden Sie unter Datei mit Berichtseinstellungen anpassen.

Nächste Schritte