Integración con Google Analytics 4

En esta página, se describen las configuraciones necesarias para transferir datos de Google Analytics 4 (GA4) como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.

GA4 es la versión más reciente de Google Analytics. Proporciona una vista integral del comportamiento de los usuarios, que se enfoca en el seguimiento basado en eventos y el aprendizaje automático para ofrecer estadísticas más detalladas. Cortex Framework te permite extraer datos de GA4 y, luego, integrarlos en BigQuery para realizar análisis y informes más detallados. Puedes obtener estadísticas valiosas y generar mejores resultados comerciales.

En el siguiente diagrama, se describe cómo los datos de GA4 están disponibles a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:

Fuente de datos de GA4

Figura 1. Fuente de datos de GA4.

Archivo de configuración

El archivo config.json configura la configuración necesaria para conectarse a fuentes de datos y transferir datos desde varias cargas de trabajo. Este archivo contiene los siguientes parámetros para GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

En la siguiente tabla, se describe el valor de cada parámetro de marketing:

Parámetro Significado Valor predeterminado Descripción
marketing.deployGA4 Implementa GA4 true Ejecuta la implementación de la fuente de datos de GA4.
marketing.GA4.datasets.cdc Conjuntos de datos de BigQuery Export para GA4 [{"property_id": 0, "name": ""}] Es un array de conjuntos de datos de exportación de BigQuery de Google Analytics 4. Cada elemento especifica Property ID como INT, así como el nombre del conjunto de datos de exportación de BigQuery correspondiente.
marketing.GA4.datasets.reporting Conjunto de datos de informes para GA4 REPORTING_GA4 Conjunto de datos de informes de GA4.

Modelo de datos

En esta sección, se describe el modelo de datos de GA4 con el diagrama de relaciones de entidades (ERD).

Diagrama de relaciones de entidades de GA4

Figura 2: GA4: Diagrama de relaciones de entidades.

Vistas básicas

Estos son los objetos azules del ERE y son vistas en tablas de CDC con transformaciones mínimas para descomprimir estructuras de datos complejas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls.

Vistas de informes

Estos son los objetos verdes del ERE y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls.

Cómo configurar la integración para GA4

La base de datos de Cortex Framework se integra a GA4 mediante la creación de una capa de informes sobre los conjuntos de datos de BigQuery Export de GA4 (que se tratan como conjuntos de datos de CDC en la arquitectura de Cortex Framework). Para ello, se crean vistas de tiempo de ejecución sobre las tablas de los CDC o se ejecutan DAG de Cloud Composer para datos materializados en tablas de BigQuery, según la configuración de los informes.

Cómo configurar BigQuery Export de GA4

Cortex Framework usa la función BigQuery Export de GA4 para cargar datos del sistema de origen en BigQuery. Sigue las instrucciones para configurar BigQuery Export o cada propiedad de GA4 en este artículo de ayuda de GA4: GA4: Cómo configurar BigQuery Export.

Problemas conocidos, limitaciones y otras consideraciones

Ten en cuenta lo siguiente cuando configures BigQuery Export de GA4:

  • Reabastecimiento: BigQuery Export de GA4 comienza a partir del día en que se configura y no hay reabastecimiento.
  • Diferencias entre las cifras registradas en la IU de GA4 y Cortex Framework: Varios factores, incluidos, sin limitaciones, el muestreo, la demora en la recopilación de datos y los informes de alta cardinalidad, pueden causar discrepancias menores entre la IU de Google Analytics y Cortex Framework. Esta es una limitación conocida y natural de Google Analytics. Para obtener más información, consulta Cómo cerrar la brecha entre la IU de Google Analytics y BigQuery Export .
  • Restricciones de volumen de exportación de eventos: Según la edición de Google Analytics que uses, es posible que tengas que enfrentar diferentes grados de restricción de volumen de exportación de BigQuery por día. Para obtener más información, consulta GA4: Cómo configurar BigQuery Export.
  • Zona horaria: En BigQuery Export, event_date se establece en la zona horaria de informes de la propiedad, mientras que event_timestamp es la marca de tiempo UTC en microsegundos. Como resultado, si se usa event_timestamp, asegúrate de ajustar la zona horaria correcta de los informes cuando realices la comparación con los números de la IU.
  • Exportaciones de eventos diarios en comparación con las de transmisión (en tiempo real): En el caso de las exportaciones de eventos, el framework de Cortex solo admite las tablas events_YYYYMMDD que crea la exportación diaria completa. Para obtener más información, consulta GA4: BigQuery Export.
  • Acuerdo de Nivel de Servicio (ANS) de GA4 360 para BigQuery Export: Aunque Cortex Framework no admite las tablas events_fresh_ que crean las exportaciones con actualización diaria como tablas de origen independientes, puedes seguir los comentarios de personalización de ##CORTEX-CUSTOMER en la vista de informes Events para reemplazar las tablas de origen con estas y aprovechar el ANS que proporciona esta función. Todas las vistas de informes seguirán funcionando después de esta sustitución.

Actualización y demora de los datos

Como regla general, la actualización de los datos de las fuentes de datos de Cortex Framework se limita a lo que permite la conexión upstream, así como a la frecuencia de la ejecución de tu DAG. Ajusta la frecuencia de ejecución de tu DAG para que se alinee con la frecuencia upstream, las restricciones de recursos y las necesidades de tu empresa.

Con Google Analytics 4, los datos de la exportación a BigQuery pueden retrasarse hasta un día según tu zona horaria, a menos que uses la exportación diaria actualizada.

Configuraciones

En esta sección, se describen las configuraciones del proceso de datos.

Conexiones de Cloud Composer

Crea las siguientes conexiones en Cloud Composer. Consulta más detalles en la documentación para administrar conexiones de Airflow.

Nombre de la conexión Purpose
dv360_cdc_bq Para conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC.
dv360_reporting_bq Para el conjunto de datos de CDC > Transferencia de conjuntos de datos de informes.

Configuración de informes

Puedes configurar y controlar cómo Cortex Framework genera datos para la capa de informes final de GA4 con el archivo de configuración de informes src/GA4/config/reporting_settings.yaml. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).

Para obtener más información, consulta Cómo personalizar el archivo de configuración de informes.

Próximos pasos