Integrazione con Google Analytics 4
Questa pagina descrive le configurazioni necessarie per importare i dati da Google Analytics 4 (GA4) come origine dati del carico di lavoro di marketing di Cortex Framework Data Foundation.
GA4 è la versione più recente di Google Analytics. Fornisce una visione olistica del comportamento degli utenti, concentrandosi sul monitoraggio basato sugli eventi e sul machine learning per offrire approfondimenti più approfonditi. Cortex Framework ti consente di estrarre i dati da GA4 e di integrarli in BigQuery per ulteriori analisi e report. Puoi ottenere informazioni preziose e migliorare i risultati aziendali.
Il seguente diagramma descrive come i dati GA4 sono disponibili tramite il carico di lavoro di marketing di Cortex Framework Data Foundation:
File di configurazione
Il file config.json
configura le impostazioni necessarie per connettersi alle origini dati per il trasferimento
di dati da vari workload. Questo file contiene i seguenti parametri per GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
La tabella seguente descrive il valore di ciascun parametro di marketing:
Parametro | Significato | Valore predefinito | Descrizione |
marketing.deployGA4
|
Esegui il deployment di GA4 | true
|
Esegui il deployment per l'origine dati GA4. |
marketing.GA4.datasets.cdc
|
Set di dati BigQuery Export per GA4 | [{"property_id": 0, "name": ""}]
|
Array di set di dati di BigQuery Export di Google Analytics 4. Ogni elemento specifica Property ID come
INT , nonché il nome del set di dati BigQuery Export corrispondente.
|
marketing.GA4.datasets.reporting
|
Set di dati dei report per GA4 | REPORTING_GA4
|
Set di dati dei report per GA4. |
Modello dati
Questa sezione descrive il modello di dati GA4 utilizzando il diagramma di relazione tra entità (ERD).
Visualizzazioni di base
Questi sono gli oggetti blu nell'ERD e sono viste sulle tabelle CDC con trasformazioni minime per scompattare strutture di dati complesse. Visualizza gli script in
src/marketing/src/GA4/src/reporting/ddls
.
Viste report
Si tratta degli oggetti verdi nell'ERD e sono visualizzazioni dei report che contengono
metriche aggregate. Visualizza gli script in
src/marketing/src/GA4/src/reporting/ddls
.
Configurare l'integrazione per GA4
Cortex Framework Data Foundation si integra con GA4 creando un livello di reporting sui set di dati BigQuery Export di GA4 (considerati come set di dati CDC nell'architettura di Cortex Framework). Questo viene ottenuto creando viste di runtime sulle tabelle CDC o eseguendo DAG di Cloud Composer per i dati materializzati nelle tabelle BigQuery, a seconda della configurazione delle impostazioni di generazione di report.
Configurare BigQuery Export di GA4
Cortex Framework utilizza la funzionalità BigQuery Export di GA4 per caricare i dati dal sistema di origine in BigQuery. Segui le istruzioni per configurare BigQuery Export o ogni proprietà GA4 riportate in questo articolo del Centro assistenza GA4: GA4 - Configurare BigQuery Export.
Problemi noti, limitazioni e altre considerazioni
Tieni presente quanto segue quando configuri BigQuery Export di GA4:
- Backfill: BigQuery Export di GA4 inizia dal giorno in cui viene configurato e non viene eseguito alcun backfill.
- Differenza tra i numeri riportati nell'interfaccia utente di GA4 e in Cortex Framework: diversi fattori, tra cui, a titolo esemplificativo, il campionamento, il ritardo nella raccolta dei dati e i report ad alta cardinalità, possono causare una discrepanza minore tra l'interfaccia utente di Google Analytics e Cortex Framework. Si tratta di una limitazione nota e innata di Google Analytics. Per ulteriori informazioni, consulta Colmare il divario tra l'interfaccia utente di Google Analytics e BigQuery Export .
- Limitazioni del volume di esportazione di eventi: a seconda della versione di Google Analytics, potresti riscontrare un diverso grado di limitazione del volume di esportazione di BigQuery al giorno. Per ulteriori informazioni, consulta GA4 - Configurare BigQuery Export.
- Fuso orario: in BigQuery Export,
event_date
è impostato nel fuso orario dei report della proprietà, mentreevent_timestamp
è il timestamp UTC in microsecondi. Di conseguenza, se viene utilizzatoevent_timestamp
, assicurati di modificare il fuso orario corretto dei report quando esegui il confronto con i numeri dell'interfaccia utente. - Esportazioni di eventi giornaliere rispetto a quelle streaming (in tempo reale): per le esportazioni di eventi,
Cortex Framework supporta solo le tabelle
events_YYYYMMDD
create dall'esportazione giornaliera completa. Per ulteriori informazioni, consulta GA4 - BigQuery Export. - Accordo sul livello del servizio (SLA) di GA4 360 per BigQuery Export:
sebbene Cortex Framework non supporti le tabelle
events_fresh_
create dalle esportazioni giornaliere aggiornate come tabelle di origine distinte, puoi seguire i commenti di personalizzazione##CORTEX-CUSTOMER
nella visualizzazione reportEvents
per sostituire le tabelle di origine con queste, in modo da sfruttare lo SLA fornito da questa funzionalità. Tutte le visualizzazioni dei report continueranno a funzionare dopo questa sostituzione.
Aggiornamento e ritardo dei dati
Come regola generale, l'aggiornamento dei dati per le origini dati di Cortex Framework è limitato da ciò che consente la connessione a monte, nonché dalla frequenza di esecuzione del DAG. Modifica la frequenza di esecuzione del DAG in modo che sia in linea con la frequenza a monte, i vincoli delle risorse e le esigenze della tua attività.
Con Google Analytics 4, i dati di BigQuery Export possono subire un ritardo fino a un giorno, a seconda del fuso orario, a meno che non utilizzi Esportazione giornaliera aggiornata.
Configurazioni
Questa sezione descrive le configurazioni per l'elaborazione dei dati.
Connessioni Cloud Composer
Crea le seguenti connessioni in Cloud Composer. Per ulteriori dettagli, consulta la documentazione sulla gestione delle connessioni Airflow.
Nome connessione | Purpose |
dv360_cdc_bq
|
Per il trasferimento del set di dati non elaborato > set di dati CDC. |
dv360_reporting_bq
|
Per il trasferimento del set di dati CDC > set di dati report. |
Impostazioni report
Puoi configurare e controllare in che modo Cortex Framework genera i dati per il livello di generazione di report finale di GA4 utilizzando il file di impostazioni dei report src/GA4/config/reporting_settings.yaml
. Questo file controlla la modalità di generazione degli oggetti BigQuery del livello di generazione di report
(tabelle, visualizzazioni,funzioni o stored procedure).
Per ulteriori informazioni, vedi Personalizzare il file delle impostazioni dei report.
Passaggi successivi
- Per ulteriori informazioni su altre origini dati e carichi di lavoro, consulta Origini dati e carichi di lavoro.
- Per ulteriori informazioni sulla procedura di implementazione negli ambienti di produzione, consulta Prerequisiti per l'implementazione di Data Foundation di Cortex Framework.