Integrazione con Google Analytics 4

Questa pagina descrive le configurazioni necessarie per importare i dati da Google Analytics 4 (GA4) come origine dati del carico di lavoro di marketing di Cortex Framework Data Foundation.

GA4 è la versione più recente di Google Analytics. Fornisce una visione olistica del comportamento degli utenti, concentrandosi sul monitoraggio basato sugli eventi e sul machine learning per offrire approfondimenti più approfonditi. Cortex Framework ti consente di estrarre i dati da GA4 e di integrarli in BigQuery per ulteriori analisi e report. Puoi ottenere informazioni preziose e migliorare i risultati aziendali.

Il seguente diagramma descrive come i dati GA4 sono disponibili tramite il carico di lavoro di marketing di Cortex Framework Data Foundation:

Origine dati GA4

Figura 1. Origine dati GA4.

File di configurazione

Il file config.json configura le impostazioni necessarie per connettersi alle origini dati per il trasferimento di dati da vari workload. Questo file contiene i seguenti parametri per GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

La tabella seguente descrive il valore di ciascun parametro di marketing:

Parametro Significato Valore predefinito Descrizione
marketing.deployGA4 Esegui il deployment di GA4 true Esegui il deployment per l'origine dati GA4.
marketing.GA4.datasets.cdc Set di dati BigQuery Export per GA4 [{"property_id": 0, "name": ""}] Array di set di dati di BigQuery Export di Google Analytics 4. Ogni elemento specifica Property ID come INT, nonché il nome del set di dati BigQuery Export corrispondente.
marketing.GA4.datasets.reporting Set di dati dei report per GA4 REPORTING_GA4 Set di dati dei report per GA4.

Modello dati

Questa sezione descrive il modello di dati GA4 utilizzando il diagramma di relazione tra entità (ERD).

Diagramma delle relazioni tra entità per GA4

Figura 2. GA4: diagramma delle relazioni tra entità.

Visualizzazioni di base

Questi sono gli oggetti blu nell'ERD e sono viste sulle tabelle CDC con trasformazioni minime per scompattare strutture di dati complesse. Visualizza gli script in src/marketing/src/GA4/src/reporting/ddls.

Viste report

Si tratta degli oggetti verdi nell'ERD e sono visualizzazioni dei report che contengono metriche aggregate. Visualizza gli script in src/marketing/src/GA4/src/reporting/ddls.

Configurare l'integrazione per GA4

Cortex Framework Data Foundation si integra con GA4 creando un livello di reporting sui set di dati BigQuery Export di GA4 (considerati come set di dati CDC nell'architettura di Cortex Framework). Questo viene ottenuto creando viste di runtime sulle tabelle CDC o eseguendo DAG di Cloud Composer per i dati materializzati nelle tabelle BigQuery, a seconda della configurazione delle impostazioni di generazione di report.

Configurare BigQuery Export di GA4

Cortex Framework utilizza la funzionalità BigQuery Export di GA4 per caricare i dati dal sistema di origine in BigQuery. Segui le istruzioni per configurare BigQuery Export o ogni proprietà GA4 riportate in questo articolo del Centro assistenza GA4: GA4 - Configurare BigQuery Export.

Problemi noti, limitazioni e altre considerazioni

Tieni presente quanto segue quando configuri BigQuery Export di GA4:

  • Backfill: BigQuery Export di GA4 inizia dal giorno in cui viene configurato e non viene eseguito alcun backfill.
  • Differenza tra i numeri riportati nell'interfaccia utente di GA4 e in Cortex Framework: diversi fattori, tra cui, a titolo esemplificativo, il campionamento, il ritardo nella raccolta dei dati e i report ad alta cardinalità, possono causare una discrepanza minore tra l'interfaccia utente di Google Analytics e Cortex Framework. Si tratta di una limitazione nota e innata di Google Analytics. Per ulteriori informazioni, consulta Colmare il divario tra l'interfaccia utente di Google Analytics e BigQuery Export .
  • Limitazioni del volume di esportazione di eventi: a seconda della versione di Google Analytics, potresti riscontrare un diverso grado di limitazione del volume di esportazione di BigQuery al giorno. Per ulteriori informazioni, consulta GA4 - Configurare BigQuery Export.
  • Fuso orario: in BigQuery Export, event_date è impostato nel fuso orario dei report della proprietà, mentre event_timestamp è il timestamp UTC in microsecondi. Di conseguenza, se viene utilizzato event_timestamp, assicurati di modificare il fuso orario corretto dei report quando esegui il confronto con i numeri dell'interfaccia utente.
  • Esportazioni di eventi giornaliere rispetto a quelle streaming (in tempo reale): per le esportazioni di eventi, Cortex Framework supporta solo le tabelle events_YYYYMMDD create dall'esportazione giornaliera completa. Per ulteriori informazioni, consulta GA4 - BigQuery Export.
  • Accordo sul livello del servizio (SLA) di GA4 360 per BigQuery Export: sebbene Cortex Framework non supporti le tabelle events_fresh_ create dalle esportazioni giornaliere aggiornate come tabelle di origine distinte, puoi seguire i commenti di personalizzazione ##CORTEX-CUSTOMER nella visualizzazione report Events per sostituire le tabelle di origine con queste, in modo da sfruttare lo SLA fornito da questa funzionalità. Tutte le visualizzazioni dei report continueranno a funzionare dopo questa sostituzione.

Aggiornamento e ritardo dei dati

Come regola generale, l'aggiornamento dei dati per le origini dati di Cortex Framework è limitato da ciò che consente la connessione a monte, nonché dalla frequenza di esecuzione del DAG. Modifica la frequenza di esecuzione del DAG in modo che sia in linea con la frequenza a monte, i vincoli delle risorse e le esigenze della tua attività.

Con Google Analytics 4, i dati di BigQuery Export possono subire un ritardo fino a un giorno, a seconda del fuso orario, a meno che non utilizzi Esportazione giornaliera aggiornata.

Configurazioni

Questa sezione descrive le configurazioni per l'elaborazione dei dati.

Connessioni Cloud Composer

Crea le seguenti connessioni in Cloud Composer. Per ulteriori dettagli, consulta la documentazione sulla gestione delle connessioni Airflow.

Nome connessione Purpose
dv360_cdc_bq Per il trasferimento del set di dati non elaborato > set di dati CDC.
dv360_reporting_bq Per il trasferimento del set di dati CDC > set di dati report.

Impostazioni report

Puoi configurare e controllare in che modo Cortex Framework genera i dati per il livello di generazione di report finale di GA4 utilizzando il file di impostazioni dei report src/GA4/config/reporting_settings.yaml. Questo file controlla la modalità di generazione degli oggetti BigQuery del livello di generazione di report (tabelle, visualizzazioni,funzioni o stored procedure).

Per ulteriori informazioni, vedi Personalizzare il file delle impostazioni dei report.

Passaggi successivi