Intégration à Google Analytics 4

Cette page décrit les configurations requises pour importer des données à partir de Google Analytics 4 (GA4) en tant que source de données de la charge de travail marketing de Cortex Framework Data Foundation.

GA4 est la dernière version de Google Analytics. Il offre une vue globale du comportement des utilisateurs, en se concentrant sur le suivi basé sur les événements et le machine learning pour fournir des insights plus approfondis. Cortex Framework vous permet d'extraire des données de GA4 et de les intégrer à BigQuery pour une analyse et une création de rapports plus approfondies. Vous pouvez ainsi obtenir des insights utiles et améliorer vos résultats commerciaux.

Le diagramme suivant décrit comment les données GA4 sont disponibles via la charge de travail marketing de Cortex Framework Data Foundation:

Source de données GA4

Figure 1 Source de données GA4.

Fichier de configuration

Le fichier config.json configure les paramètres requis pour se connecter aux sources de données afin de transférer des données à partir de différentes charges de travail. Ce fichier contient les paramètres suivants pour GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

Le tableau suivant décrit la valeur de chaque paramètre marketing:

Paramètre Signification Valeur par défaut Description
marketing.deployGA4 Déployer GA4 true Exécutez le déploiement pour la source de données GA4.
marketing.GA4.datasets.cdc Ensembles de données d'exportation BigQuery pour GA4 [{"property_id": 0, "name": ""}] Tableau de données d'exportation BigQuery Google Analytics 4. Chaque élément spécifie Property ID comme INT, ainsi que le nom de l'ensemble de données BigQuery Export correspondant.
marketing.GA4.datasets.reporting Ensemble de données de reporting pour GA4 REPORTING_GA4 Ensemble de données de reporting pour GA4.

Modèle de données

Cette section décrit le modèle de données GA4 à l'aide du diagramme des relations entre entités (ERD).

Diagramme des relations entre entités pour GA4

Figure 2 GA4: diagramme des relations entre les entités.

Vues de base

Il s'agit des objets bleus de l'ERD. Il s'agit de vues sur les tables CDC avec des transformations minimales pour décompresser des structures de données complexes. Consultez les scripts dans src/marketing/src/GA4/src/reporting/ddls.

Vues de rapports

Il s'agit des objets verts de l'ERD. Il s'agit de vues de rapports contenant des métriques agrégées. Consultez les scripts dans src/marketing/src/GA4/src/reporting/ddls.

Configurer l'intégration pour GA4

La fondation de données Cortex Framework s'intègre à GA4 en créant une couche de reporting au-dessus des ensembles de données BigQuery Export de GA4 (traités comme des ensembles de données CDC dans l'architecture Cortex Framework). Pour ce faire, créez des vues d'exécution au-dessus des tables CDC ou exécutez des DAG Cloud Composer pour les données matérialisées dans les tables BigQuery, en fonction de la configuration des paramètres de création de rapports.

Configurer BigQuery Export pour GA4

Cortex Framework utilise la fonctionnalité BigQuery Export de GA4 pour charger les données du système source dans BigQuery. Suivez les instructions de configuration de BigQuery Export ou de chaque propriété GA4 dans cet article d'aide GA4 : GA4 : Configurer BigQuery Export.

Problèmes connus, limites et autres considérations

Tenez compte des points suivants lorsque vous configurez BigQuery Export pour GA4:

  • Remplissage: BigQuery Export GA4 commence à partir du jour où il est configuré et aucun remplissage n'est effectué.
  • Différence entre les chiffres indiqués dans l'interface utilisateur GA4 et ceux du framework Cortex : plusieurs facteurs, y compris, mais sans s'y limiter, l'échantillonnage, le délai de collecte des données et les rapports à cardinalité élevée, peuvent entraîner des écarts mineurs entre l'interface utilisateur Google Analytics et le framework Cortex. Il s'agit d'une limitation connue et innée de Google Analytics. Pour en savoir plus, consultez Combler l'écart entre l'interface utilisateur Google Analytics et BigQuery Export .
  • Restrictions de volume d'exportation d'événements: selon votre édition Google Analytics, vous pouvez rencontrer des restrictions de volume d'exportation BigQuery variables par jour. Pour en savoir plus, consultez GA4 : Configurer BigQuery Export.
  • Fuseau horaire: dans BigQuery Export, event_date est défini sur le fuseau horaire de reporting de la propriété, tandis que event_timestamp correspond au code temporel UTC en microsecondes. Par conséquent, si event_timestamp est utilisé, veillez à ajuster le fuseau horaire de création des rapports pour le comparer aux numéros de l'UI.
  • Exportations d'événements quotidiennes par rapport aux exportations d'événements en streaming (en temps réel): pour les exportations d'événements, Cortex Framework n'est compatible qu'avec les tables events_YYYYMMDD créées par l'exportation quotidienne complète. Pour en savoir plus, consultez GA4 : BigQuery Export.
  • Contrat de niveau de service (CLD) GA4 360 pour BigQuery Export : bien que Cortex Framework n'accepte pas les tables events_fresh_ créées par les exportations Mise à jour quotidienne en tant que tables sources distinctes, vous pouvez suivre les commentaires de personnalisation ##CORTEX-CUSTOMER dans la vue de reporting Events pour remplacer les tables sources par celles-ci afin de profiter du CLD fourni par cette fonctionnalité. Toutes les vues de rapports continueront de fonctionner après ce remplacement.

Fraîcheur des données et délai

En règle générale, la fraîcheur des données pour les sources de données Cortex Framework est limitée par ce que la connexion en amont permet, ainsi que par la fréquence d'exécution de votre DAG. Ajustez la fréquence d'exécution de votre DAG pour qu'elle corresponde à la fréquence en amont, aux contraintes de ressources et aux besoins de votre entreprise.

Avec Google Analytics 4, les données d'exportation BigQuery peuvent être retardées jusqu'à une journée, en fonction de votre fuseau horaire, sauf si vous utilisez Exportation quotidienne.

Configurations

Cette section décrit les configurations du traitement des données.

Connexions Cloud Composer

Créez les connexions suivantes dans Cloud Composer. Pour en savoir plus, consultez la documentation sur la gestion des connexions Airflow.

Nom de la connexion Purpose
dv360_cdc_bq Pour "Ensemble de données brut" > "Transfert d'ensemble de données CDC".
dv360_reporting_bq Pour le transfert d'un ensemble de données CDC vers un ensemble de données de reporting.

Paramètres de création de rapports

Vous pouvez configurer et contrôler la façon dont Cortex Framework génère des données pour la couche de reporting finale GA4 à l'aide du fichier de paramètres de reporting src/GA4/config/reporting_settings.yaml. Ce fichier contrôle la génération des objets BigQuery de la couche de reporting (tables, vues,fonctions ou procédures stockées).

Pour en savoir plus, consultez Personnaliser le fichier de paramètres de création de rapports.

Étape suivante