Integración con Google Analytics 4
En esta página, se describen las configuraciones necesarias para transferir datos de Google Analytics 4 (GA4) como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.
GA4 es la versión más reciente de Google Analytics. Proporciona una vista integral del comportamiento de los usuarios, que se enfoca en el seguimiento basado en eventos y el aprendizaje automático para ofrecer estadísticas más detalladas. Cortex Framework te permite extraer datos de GA4 y, luego, integrarlos en BigQuery para realizar análisis y informes más detallados. Puedes obtener estadísticas valiosas y generar mejores resultados comerciales.
En el siguiente diagrama, se describe cómo los datos de GA4 están disponibles a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:
Archivo de configuración
El archivo config.json
configura la configuración necesaria para conectarse a fuentes de datos y transferir datos desde varias cargas de trabajo. Este archivo contiene los siguientes parámetros para GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
En la siguiente tabla, se describe el valor de cada parámetro de marketing:
Parámetro | Significado | Valor predeterminado | Descripción |
marketing.deployGA4
|
Implementa GA4 | true
|
Ejecuta la implementación de la fuente de datos de GA4. |
marketing.GA4.datasets.cdc
|
Conjuntos de datos de BigQuery Export para GA4 | [{"property_id": 0, "name": ""}]
|
Es un array de conjuntos de datos de exportación de BigQuery de Google Analytics 4. Cada elemento especifica Property ID como INT , así como el nombre del conjunto de datos de exportación de BigQuery correspondiente.
|
marketing.GA4.datasets.reporting
|
Conjunto de datos de informes para GA4 | REPORTING_GA4
|
Conjunto de datos de informes de GA4. |
Modelo de datos
En esta sección, se describe el modelo de datos de GA4 con el diagrama de relaciones de entidades (ERD).
Vistas básicas
Estos son los objetos azules del ERE y son vistas en tablas de CDC con transformaciones mínimas para descomprimir estructuras de datos complejas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls
.
Vistas de informes
Estos son los objetos verdes del ERE y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls
.
Cómo configurar la integración para GA4
La base de datos de Cortex Framework se integra a GA4 mediante la creación de una capa de informes sobre los conjuntos de datos de BigQuery Export de GA4 (que se tratan como conjuntos de datos de CDC en la arquitectura de Cortex Framework). Para ello, se crean vistas de tiempo de ejecución sobre las tablas de los CDC o se ejecutan DAG de Cloud Composer para datos materializados en tablas de BigQuery, según la configuración de los informes.
Cómo configurar BigQuery Export de GA4
Cortex Framework usa la función BigQuery Export de GA4 para cargar datos del sistema de origen en BigQuery. Sigue las instrucciones para configurar BigQuery Export o cada propiedad de GA4 en este artículo de ayuda de GA4: GA4: Cómo configurar BigQuery Export.
Problemas conocidos, limitaciones y otras consideraciones
Ten en cuenta lo siguiente cuando configures BigQuery Export de GA4:
- Reabastecimiento: BigQuery Export de GA4 comienza a partir del día en que se configura y no hay reabastecimiento.
- Diferencias entre las cifras registradas en la IU de GA4 y Cortex Framework: Varios factores, incluidos, sin limitaciones, el muestreo, la demora en la recopilación de datos y los informes de alta cardinalidad, pueden causar discrepancias menores entre la IU de Google Analytics y Cortex Framework. Esta es una limitación conocida y natural de Google Analytics. Para obtener más información, consulta Cómo cerrar la brecha entre la IU de Google Analytics y BigQuery Export .
- Restricciones de volumen de exportación de eventos: Según la edición de Google Analytics que uses, es posible que tengas que enfrentar diferentes grados de restricción de volumen de exportación de BigQuery por día. Para obtener más información, consulta GA4: Cómo configurar BigQuery Export.
- Zona horaria: En BigQuery Export,
event_date
se establece en la zona horaria de informes de la propiedad, mientras queevent_timestamp
es la marca de tiempo UTC en microsegundos. Como resultado, si se usaevent_timestamp
, asegúrate de ajustar la zona horaria correcta de los informes cuando realices la comparación con los números de la IU. - Exportaciones de eventos diarios en comparación con las de transmisión (en tiempo real): En el caso de las exportaciones de eventos, el framework de Cortex solo admite las tablas
events_YYYYMMDD
que crea la exportación diaria completa. Para obtener más información, consulta GA4: BigQuery Export. - Acuerdo de Nivel de Servicio (ANS) de GA4 360 para BigQuery Export: Aunque Cortex Framework no admite las tablas
events_fresh_
que crean las exportaciones con actualización diaria como tablas de origen independientes, puedes seguir los comentarios de personalización de##CORTEX-CUSTOMER
en la vista de informesEvents
para reemplazar las tablas de origen con estas y aprovechar el ANS que proporciona esta función. Todas las vistas de informes seguirán funcionando después de esta sustitución.
Actualización y demora de los datos
Como regla general, la actualización de los datos de las fuentes de datos de Cortex Framework se limita a lo que permite la conexión upstream, así como a la frecuencia de la ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para que se alinee con la frecuencia upstream, las restricciones de recursos y las necesidades de tu empresa.
Con Google Analytics 4, los datos de la exportación a BigQuery pueden retrasarse hasta un día según tu zona horaria, a menos que uses la exportación diaria actualizada.
Configuraciones
En esta sección, se describen las configuraciones del proceso de datos.
Conexiones de Cloud Composer
Crea las siguientes conexiones en Cloud Composer. Consulta más detalles en la documentación para administrar conexiones de Airflow.
Nombre de la conexión | Purpose |
dv360_cdc_bq
|
Para conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC. |
dv360_reporting_bq
|
Para el conjunto de datos de CDC > Transferencia de conjuntos de datos de informes. |
Configuración de informes
Puedes configurar y controlar cómo Cortex Framework genera datos para la capa de informes final de GA4 con el archivo de configuración de informes src/GA4/config/reporting_settings.yaml
. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).
Para obtener más información, consulta Cómo personalizar el archivo de configuración de informes.
Próximos pasos
- Para obtener más información sobre otras fuentes de datos y cargas de trabajo, consulta Fuentes de datos y cargas de trabajo.
- Para obtener más información sobre los pasos para la implementación en entornos de producción, consulta los requisitos previos para la implementación de Data Foundation de Cortex Framework.