Integración con Google Analytics 4

En esta página se describen las configuraciones necesarias para importar datos de Google Analytics 4 (GA4) como fuente de datos de la carga de trabajo de marketing de Cortex Framework Data Foundation.

GA4 es la versión más reciente de Google Analytics. Ofrece una visión integral del comportamiento de los usuarios, centrándose en el seguimiento basado en eventos y en el aprendizaje automático para ofrecer estadísticas más detalladas. Cortex Framework te permite extraer datos de GA4 e integrarlos en BigQuery para analizarlos y generar informes. Puedes obtener estadísticas valiosas y mejorar los resultados empresariales.

En el siguiente diagrama se describe cómo se puede acceder a los datos de GA4 a través de la carga de trabajo de marketing de Cortex Framework Data Foundation:

Fuente de datos de GA4

Imagen 1. Fuente de datos de GA4.

Archivo de configuración

El archivo config.json configura los ajustes necesarios para conectarse a fuentes de datos y transferir datos de varias cargas de trabajo. Este archivo contiene los siguientes parámetros de GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

En la siguiente tabla se describe el valor de cada parámetro de marketing:

Parámetro Significado Valor predeterminado Descripción
marketing.deployGA4 Implementar GA4 true Ejecute la implementación de la fuente de datos de GA4.
marketing.GA4.datasets.cdc Conjuntos de datos de exportación de BigQuery para GA4 [{"property_id": 0, "name": ""}] Matriz de conjuntos de datos de exportación de BigQuery de Google Analytics 4. Cada elemento especifica Property ID como INT, así como el nombre del conjunto de datos de BigQuery Export correspondiente.
marketing.GA4.datasets.reporting Conjunto de datos de informes de GA4 REPORTING_GA4 Conjunto de datos de informes de GA4.

Modelo de datos

En esta sección se describe el modelo de datos de GA4 mediante el diagrama de relaciones entre entidades.

Diagrama de relación entre entidades de GA4

Imagen 2. GA4: diagrama de relación entre entidades.

Vistas básicas

Son los objetos azules del diagrama ER y son vistas de las tablas de CDC con transformaciones mínimas para descomprimir estructuras de datos complejas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls.

Vistas de informes

Son los objetos verdes del diagrama ER y son vistas de informes que contienen métricas agregadas. Consulta las secuencias de comandos en src/marketing/src/GA4/src/reporting/ddls.

Configurar la integración de GA4

Cortex Framework Data Foundation se integra con GA4 creando una capa de informes sobre los conjuntos de datos de exportación de BigQuery de GA4 (tratados como conjuntos de datos de CDC en la arquitectura de Cortex Framework). Para ello, se crean vistas de tiempo de ejecución sobre las tablas de CDC o se ejecutan DAGs de Cloud Composer para los datos materializados en tablas de BigQuery, en función de la configuración de los ajustes de informes.

Configurar BigQuery Export en GA4

Cortex Framework usa la función de exportación de BigQuery de GA4 para cargar datos del sistema de origen en BigQuery. Siga las instrucciones para configurar BigQuery Export en cada propiedad de GA4 que se indican en este artículo de ayuda de GA4: GA4 - Configurar BigQuery Export.

Problemas conocidos, limitaciones y otras consideraciones

Tenga en cuenta lo siguiente al configurar BigQuery Export de GA4:

  • Relleno retroactivo: BigQuery Export de GA4 empieza a registrar datos el día en que se configura y no se rellena retroactivamente.
  • Diferencia entre los números registrados en la interfaz de usuario de GA4 y en el framework Cortex: Varios factores, como el muestreo, el retraso en la recogida de datos y los informes de alta cardinalidad, pueden provocar pequeñas discrepancias entre la interfaz de usuario de Google Analytics y el framework Cortex. Esta es una limitación conocida e inherente de Google Analytics. Para obtener más información, consulte el artículo Cómo acortar las diferencias entre los datos de la interfaz de Google Analytics y los exportados a BigQuery .
  • Restricciones de volumen de exportación de eventos: en función de la edición de Google Analytics que tenga, puede que se apliquen diferentes restricciones de volumen de exportación de BigQuery al día. Para obtener más información, consulte el artículo [GA4] Configurar BigQuery Export.
  • Zona horaria: en BigQuery Export, event_date se define en la zona horaria de los informes de la propiedad, mientras que event_timestamp es la marca de tiempo UTC en microsegundos. Por lo tanto, si se utiliza event_timestamp, asegúrate de ajustarlo a la zona horaria correcta de los informes cuando se compare con las cifras de la interfaz de usuario.
  • Exportaciones de eventos diarias y de flujo (en tiempo real): en el caso de las exportaciones de Event, Cortex Framework solo admite las tablas events_YYYYMMDD creadas mediante la exportación diaria completa. Para obtener más información, consulte el artículo GA4 - BigQuery Export.
  • Acuerdo de nivel de servicio de GA4 360 para BigQuery Export: Aunque Cortex Framework no admite las tablas events_fresh_ creadas por las exportaciones de actualización diaria como tablas de origen independientes, puede seguir los comentarios de personalización de ##CORTEX-CUSTOMER en la vista Informes Events para sustituir las tablas de origen por estas y aprovechar el acuerdo de nivel de servicio que ofrece esta función. Todas las vistas de informes seguirán funcionando después de este cambio.

Actualización y latencia de los datos

Por lo general, la actualización de los datos de las fuentes de datos de Cortex Framework está limitada por lo que permite la conexión ascendente, así como por la frecuencia de ejecución de tu DAG. Ajusta la frecuencia de ejecución del DAG para que se adapte a la frecuencia de la fuente, las restricciones de recursos y tus necesidades empresariales.

Con Google Analytics 4, los datos de BigQuery Export pueden tardar hasta un día en exportarse, en función de su zona horaria, a menos que utilice la exportación diaria actualizada.

Configuraciones

En esta sección se describen las configuraciones del proceso de datos.

Conexiones de Cloud Composer

Crea las siguientes conexiones en Cloud Composer. Para obtener más información, consulta la documentación sobre cómo gestionar conexiones de Airflow.

Nombre de la conexión Purpose
dv360_cdc_bq En Conjunto de datos sin procesar > Transferencia de conjunto de datos de CDC.
dv360_reporting_bq Para el conjunto de datos de CDC > conjunto de datos de informes transferencia.

Configuración de informes

Puede configurar y controlar cómo genera Cortex Framework los datos de la capa de informes final de GA4 mediante el archivo de configuración de informes src/GA4/config/reporting_settings.yaml. Este archivo controla cómo se generan los objetos de BigQuery de la capa de informes (tablas, vistas,funciones o procedimientos almacenados).

Para obtener más información, consulte Personalizar el archivo de configuración de informes.

Siguientes pasos