Integration mit Google Analytics 4
Auf dieser Seite werden die erforderlichen Konfigurationen beschrieben, um Daten aus Google Analytics 4 (GA4) als Datenquelle für die Marketing-Arbeitslast der Cortex Framework Data Foundation zu verwenden.
GA4 ist die neueste Version von Google Analytics. Sie bietet einen ganzheitlichen Überblick über das Nutzerverhalten und konzentriert sich dabei auf ereignisbasiertes Tracking und maschinelles Lernen, um detailliertere Informationen zu liefern. Mit Cortex Framework können Sie Daten aus GA4 extrahieren und in BigQuery für weitere Analysen und Berichte einbinden. So können Sie wertvolle Erkenntnisse gewinnen und bessere Geschäftsergebnisse erzielen.
Das folgende Diagramm zeigt, wie GA4-Daten über die Marketing-Arbeitslast von Cortex Framework Data Foundation verfügbar sind:
Konfigurationsdatei
In der Datei config.json
werden die Einstellungen konfiguriert, die für die Verbindung zu Datenquellen zur Übertragung von Daten aus verschiedenen Arbeitslasten erforderlich sind. Diese Datei enthält die folgenden Parameter für GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
In der folgenden Tabelle wird der Wert für jeden Marketingparameter beschrieben:
Parameter | Bedeutung | Standardwert | Beschreibung |
marketing.deployGA4
|
GA4 implementieren | true
|
Führen Sie die Bereitstellung für die GA4-Datenquelle aus. |
marketing.GA4.datasets.cdc
|
BigQuery Export-Datasets für GA4 | [{"property_id": 0, "name": ""}]
|
Array von Google Analytics 4-BigQuery-Exportdatensätzen Für jedes Element wird Property ID als INT und der entsprechende Name des BigQuery-Export-Datasets angegeben.
|
marketing.GA4.datasets.reporting
|
Datensatz für die Berichterstellung in GA4 | REPORTING_GA4
|
Datensatz für die Berichterstellung in GA4. |
Datenmodell
In diesem Abschnitt wird das GA4-Datenmodell anhand eines Entitätsbeziehungsdiagramms (ERD) beschrieben.
Basisansichten
Dies sind die blauen Objekte in der ERD und sind Ansichten auf CDC-Tabellen mit minimalen Transformationen, um komplexe Datenstrukturen zu entpacken. Scripts in src/marketing/src/GA4/src/reporting/ddls
ansehen
Berichtsdatenansichten
Dies sind die grünen Objekte in der ERD und Berichtsansichten, die zusammengefasste Messwerte enthalten. Scripts in src/marketing/src/GA4/src/reporting/ddls
ansehen
Integration für GA4 konfigurieren
Die Cortex Framework Data Foundation lässt sich in GA4 einbinden, indem eine Berichtsebene auf den BigQuery Export-Datasets von GA4 erstellt wird. Diese werden in der Cortex Framework-Architektur als CDC-Datasets behandelt. Dazu werden je nach Konfiguration der Berichtseinstellungen Laufzeitansichten auf CDC-Tabellen erstellt oder Cloud Composer-DAGs für materialisierte Daten in BigQuery-Tabellen ausgeführt.
GA4 BigQuery Export einrichten
Das Cortex-Framework verwendet die BigQuery Export-Funktion von GA4, um Daten aus dem Quellsystem in BigQuery zu laden. Folgen Sie der Anleitung zum Einrichten von BigQuery Export oder der Anleitung für jede GA4-Property in diesem GA4-Hilfeartikel: GA4 – BigQuery Export einrichten.
Bekannte Probleme, Einschränkungen und weitere Aspekte
Beachten Sie beim Einrichten von GA4 BigQuery Export Folgendes:
- Backfilling: Der GA4 BigQuery Export beginnt am Tag der Einrichtung und es erfolgt kein Backfilling.
- Abweichungen zwischen den in der GA4-Benutzeroberfläche und im Cortex-Framework angegebenen Zahlen: Mehrere Faktoren, darunter Stichprobenerhebung, Verzögerungen bei der Datenerhebung und Berichte mit hoher Kardinalität, können zu geringfügigen Abweichungen zwischen der Google Analytics-Benutzeroberfläche und dem Cortex-Framework führen. Dies ist eine bekannte und inhärente Einschränkung von Google Analytics. Weitere Informationen finden Sie unter Die Lücke zwischen Google Analytics-UI und BigQuery-Export schließen .
- Einschränkungen beim Volumen des Ereignisexports: Je nach Google Analytics-Version gelten für den täglichen BigQuery-Export möglicherweise Einschränkungen. Weitere Informationen finden Sie unter GA4 – BigQuery Export einrichten.
- Zeitzone: In BigQuery Export wird
event_date
in der Berichtszeitzone der Property festgelegt.event_timestamp
ist der UTC-Zeitstempel in Mikrosekunden. Wennevent_timestamp
verwendet wird, müssen Sie beim Vergleich mit den Zahlen in der Benutzeroberfläche die richtige Zeitzone für die Berichte berücksichtigen. - Täglicher Export von Ereignissen im Vergleich zu Streaming-Exporten (Echtzeit): Für Ereignis-Exporte unterstützt das Cortex-Framework nur die
events_YYYYMMDD
-Tabellen, die durch den vollständigen täglichen Export erstellt wurden. Weitere Informationen finden Sie unter GA4 – BigQuery Export. - GA4 360-Service Level Agreement (SLA) für BigQuery Export:
Das Cortex-Framework unterstützt die
events_fresh_
-Tabellen, die durch tagesaktuelle Exporte erstellt wurden, nicht als separate Quelltabellen. Sie können jedoch den##CORTEX-CUSTOMER
-Anpassungskommentaren in derEvents
-Berichtsansicht folgen, um die Quelltabellen durch diese zu ersetzen und so das SLA für diese Funktion zu nutzen. Alle Berichtsansichten funktionieren nach der Umstellung weiterhin.
Datenaktualität und Verzögerung
Im Allgemeinen ist die Datenaktualität für Cortex Framework-Datenquellen durch die Möglichkeiten der Upstream-Verbindung und die Häufigkeit der DAG-Ausführung begrenzt. Passen Sie die Ausführungshäufigkeit des DAG an die Upstream-Frequenz, die Ressourcenbeschränkungen und Ihre Geschäftsanforderungen an.
In Google Analytics 4 können sich die Daten im BigQuery-Export je nach Zeitzone um bis zu einen Tag verzögern, es sei denn, Sie verwenden den tagesaktuellen Export.
Konfigurationen
In diesem Abschnitt werden die Konfigurationen für den Datenablauf beschrieben.
Cloud Composer-Verbindungen
Erstellen Sie die folgenden Verbindungen in Cloud Composer. Weitere Informationen finden Sie in der Dokumentation zum Verwalten von Airflow-Verbindungen.
Verbindungsname | Purpose |
dv360_cdc_bq
|
Für die Übertragung von Rohdatensätzen > CDC-Datensätzen. |
dv360_reporting_bq
|
Für CDC-Dataset > Berichtsdatensatzübertragung |
Berichtseinstellungen
Mit der Datei „Berichtseinstellungen“ src/GA4/config/reporting_settings.yaml
können Sie konfigurieren und steuern, wie das Cortex Framework Daten für die GA4-Berichtsebene generiert. In dieser Datei wird festgelegt, wie BigQuery-Objekte der Berichtsebene (Tabellen, Ansichten, Funktionen oder gespeicherte Prozeduren) generiert werden.
Weitere Informationen finden Sie unter Datei mit Berichtseinstellungen anpassen.
Nächste Schritte
- Weitere Informationen zu anderen Datenquellen und Arbeitslasten finden Sie unter Datenquellen und Arbeitslasten.
- Weitere Informationen zu den Schritten für die Bereitstellung in Produktionsumgebungen finden Sie unter Voraussetzungen für die Bereitstellung der Cortex Framework Data Foundation.