Integración con Google Analytics 4
En esta página se describen las configuraciones necesarias para importar datos de Google Analytics 4 (GA4) como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.
GA4 es la versión más reciente de Google Analytics. Ofrece una visión integral del comportamiento de los usuarios, centrándose en el seguimiento basado en eventos y en el aprendizaje automático para ofrecer estadísticas más detalladas. Cortex Framework te permite extraer datos de GA4 e integrarlos en BigQuery para analizarlos y generar informes. Puedes obtener estadísticas valiosas y mejorar los resultados empresariales.
En el siguiente diagrama se describe cómo se puede acceder a los datos de GA4 a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:
Archivo de configuración
El archivo config.json
configura los ajustes necesarios para conectarse a fuentes de datos y transferir datos de varias cargas de trabajo. Este archivo contiene los siguientes parámetros de GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
En la siguiente tabla se describe el valor de cada parámetro de marketing:
Parámetro | Significado | Valor predeterminado | Descripción |
marketing.deployGA4
|
Implementar GA4 | true
|
Ejecute la implementación de la fuente de datos de GA4. |
marketing.GA4.datasets.cdc
|
Conjuntos de datos de exportación de BigQuery para GA4 | [{"property_id": 0, "name": ""}]
|
Matriz de conjuntos de datos de exportación de BigQuery de Google Analytics 4. Cada elemento especifica Property ID como INT , así como el nombre del conjunto de datos de BigQuery Export correspondiente.
|
marketing.GA4.datasets.reporting
|
Conjunto de datos de informes de GA4 | REPORTING_GA4
|
Conjunto de datos de informes de GA4. |
Modelo de datos
En esta sección se describe el modelo de datos de GA4 mediante el diagrama de relaciones entre entidades.
Vistas básicas
Son los objetos azules del diagrama ER y son vistas de las tablas de CDC con transformaciones mínimas para descomprimir estructuras de datos complejas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls
.
Vistas de informes
Son los objetos verdes del diagrama ER y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls
.
Configurar la integración de GA4
Cortex Framework Data Foundation se integra con GA4 creando una capa de informes sobre los conjuntos de datos de exportación de BigQuery de GA4 (tratados como conjuntos de datos de CDC en la arquitectura de Cortex Framework). Para ello, se crean vistas de tiempo de ejecución sobre las tablas de CDC o se ejecutan DAGs de Cloud Composer para los datos materializados en tablas de BigQuery, en función de la configuración de los ajustes de informes.
Configurar BigQuery Export en GA4
Cortex Framework usa la función de exportación de BigQuery de GA4 para cargar datos del sistema de origen en BigQuery. Siga las instrucciones para configurar BigQuery Export en cada propiedad de GA4 que se indican en este artículo de ayuda de GA4: GA4 - Configurar BigQuery Export.
Problemas conocidos, limitaciones y otras consideraciones
Tenga en cuenta lo siguiente al configurar BigQuery Export de GA4:
- Relleno retroactivo: BigQuery Export de GA4 empieza a registrar datos el día en que se configura y no se rellena retroactivamente.
- Diferencia entre los números registrados en la interfaz de usuario de GA4 y en el framework Cortex: Varios factores, como el muestreo, el retraso en la recogida de datos y los informes de alta cardinalidad, pueden provocar pequeñas discrepancias entre la interfaz de usuario de Google Analytics y el framework Cortex. Esta es una limitación conocida e inherente de Google Analytics. Para obtener más información, consulte el artículo Cómo acortar las diferencias entre los datos de la interfaz de Google Analytics y los exportados a BigQuery .
- Restricciones de volumen de exportación de eventos: en función de la edición de Google Analytics que tenga, puede que se apliquen diferentes restricciones de volumen de exportación de BigQuery al día. Para obtener más información, consulte el artículo [GA4] Configurar BigQuery Export.
- Zona horaria: en BigQuery Export,
event_date
se define en la zona horaria de los informes de la propiedad, mientras queevent_timestamp
es la marca de tiempo UTC en microsegundos. Por lo tanto, si se utilizaevent_timestamp
, asegúrate de ajustarlo a la zona horaria correcta de los informes cuando se compare con las cifras de la interfaz de usuario. - Exportaciones de eventos diarias y de flujo (en tiempo real): en el caso de las exportaciones de Event, Cortex Framework solo admite las tablas
events_YYYYMMDD
creadas mediante la exportación diaria completa. Para obtener más información, consulte el artículo GA4 - BigQuery Export. - Acuerdo de nivel de servicio de GA4 360 para BigQuery Export:
Aunque Cortex Framework no admite las tablas
events_fresh_
creadas por las exportaciones de actualización diaria como tablas de origen independientes, puede seguir los comentarios de personalización de##CORTEX-CUSTOMER
en la vista InformesEvents
para sustituir las tablas de origen por estas y aprovechar el acuerdo de nivel de servicio que ofrece esta función. Todas las vistas de informes seguirán funcionando después de este cambio.
Actualización y latencia de los datos
Por lo general, la actualización de los datos de las fuentes de datos de Cortex Framework está limitada por lo que permite la conexión ascendente, así como por la frecuencia de ejecución de tu DAG. Ajusta la frecuencia de ejecución del DAG para que se adapte a la frecuencia de la fuente, las restricciones de recursos y tus necesidades empresariales.
Con Google Analytics 4, los datos de BigQuery Export pueden tardar hasta un día en exportarse, en función de su zona horaria, a menos que utilice la exportación diaria actualizada.
Configuraciones
En esta sección se describen las configuraciones del proceso de datos.
Conexiones de Cloud Composer
Crea las siguientes conexiones en Cloud Composer. Para obtener más información, consulta la documentación sobre cómo gestionar conexiones de Airflow.
Nombre de la conexión | Purpose |
dv360_cdc_bq
|
En Conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC. |
dv360_reporting_bq
|
Para el conjunto de datos de CDC > conjunto de datos de informes transferencia. |
Configuración de informes
Puede configurar y controlar cómo genera Cortex Framework los datos de la capa de informes final de GA4 mediante el archivo de configuración de informes src/GA4/config/reporting_settings.yaml
. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).
Para obtener más información, consulte Personalizar el archivo de configuración de informes.
Siguientes pasos
- Para obtener más información sobre otras fuentes de datos y cargas de trabajo, consulta el artículo Fuentes de datos y cargas de trabajo.
- Para obtener más información sobre los pasos para la implementación en entornos de producción, consulta los requisitos previos para la implementación de Data Foundation de Cortex Framework.