Integração com o Google Analytics 4

Esta página descreve as configurações necessárias para importar dados do Google Analytics 4 (GA4) como origem de dados da carga de trabalho de marketing da base de dados do Cortex Framework.

O GA4 é a versão mais recente do Google Analytics. Oferece uma vista holística do comportamento do utilizador, focando-se na monitorização baseada em eventos e na aprendizagem automática para oferecer estatísticas mais detalhadas. A framework Cortex permite-lhe extrair dados do GA4 e integrá-los no BigQuery para análise e relatórios adicionais. Pode obter estatísticas valiosas e gerar melhores resultados de negócio.

O diagrama seguinte descreve como os dados do GA4 estão disponíveis através da carga de trabalho de marketing da base de dados do Cortex Framework:

Origem de dados do GA4

Figura 1. Origem de dados do GA4.

Ficheiro de configuração

O ficheiro config.json configura as definições necessárias para estabelecer ligação a origens de dados para transferir dados de várias cargas de trabalho. Este ficheiro contém os seguintes parâmetros para o GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

A tabela seguinte descreve o valor de cada parâmetro de marketing:

Parâmetro Significado Valor predefinido Descrição
marketing.deployGA4 Implemente o GA4 true Execute a implementação para a origem de dados do GA4.
marketing.GA4.datasets.cdc Conjuntos de dados do BigQuery Export para o GA4 [{"property_id": 0, "name": ""}] Matriz de conjuntos de dados do BigQuery do Google Analytics 4. Cada elemento especifica Property ID como INT, bem como o nome do conjunto de dados do BigQuery Export correspondente.
marketing.GA4.datasets.reporting Conjunto de dados de relatórios para o GA4 REPORTING_GA4 Conjunto de dados de relatórios para o GA4.

Modelo de dados

Esta secção descreve o modelo de dados do GA4 através do diagrama de relação entre entidades (ERD).

Diagrama de relação entre entidades para o GA4

Figura 2. GA4: diagrama de relação entre entidades.

Visualizações de base

Estes são os objetos azuis no DER e são vistas em tabelas de CDC com transformações mínimas para descompactar estruturas de dados complexas. Veja guiões em src/marketing/src/GA4/src/reporting/ddls.

Visualizações de propriedade de relatórios

Estes são os objetos verdes no DER e são vistas de relatórios que contêm métricas agregadas. Veja guiões em src/marketing/src/GA4/src/reporting/ddls.

Configure a integração para o GA4

A base de dados do Cortex Framework integra-se com o GA4 através da criação de uma camada de relatórios sobre os conjuntos de dados do BigQuery Export do GA4 (tratados como conjuntos de dados de CDC na arquitetura do Cortex Framework). Isto é feito através da criação de visualizações de tempo de execução com base em tabelas de CDC ou da execução de DAGs do Cloud Composer para dados materializados em tabelas do BigQuery, consoante a configuração das definições de relatórios.

Configure o BigQuery Export do GA4

A framework Cortex usa a funcionalidade BigQuery Export do GA4 para carregar dados do sistema de origem para o BigQuery. Siga as instruções para configurar o BigQuery Export para cada propriedade do GA4 neste artigo de ajuda do GA4: GA4 – Configure o BigQuery Export.

Problemas conhecidos, limitações e outras considerações

Tenha em atenção o seguinte ao configurar o BigQuery Export do GA4:

  • Preenchimento: o BigQuery Export do GA4 começa no dia em que é configurado e não existe preenchimento.
  • Diferença entre a IU do GA4 e os números comunicados pela framework Cortex: Vários fatores, incluindo, entre outros, a amostragem, o atraso na recolha de dados e os relatórios de elevada cardinalidade, podem causar uma pequena discrepância entre a IU do Google Analytics e a framework Cortex. Esta é uma limitação conhecida e inerente do Google Analytics. Para mais informações, consulte o artigo Aproximar a IU do Google Analytics e o BigQuery Export .
  • Restrições de volume de exportação de eventos: consoante a sua edição do Google Analytics, pode enfrentar vários graus de restrição de volume de exportação do BigQuery por dia. Para mais informações, consulte o artigo GA4 – Configure o BigQuery Export.
  • Fuso horário: no BigQuery Export, o valor event_date é definido no fuso horário dos relatórios da propriedade, enquanto o valor event_timestamp é a data/hora UTC em microssegundos. Como resultado, se event_timestamp for usado, certifique-se de que faz o ajuste para o fuso horário de relatórios correto quando comparar com os números da IU.
  • Exportações de eventos diárias versus com streaming (em tempo real): para exportações de eventos, a estrutura do Cortex só suporta as tabelas events_YYYYMMDD criadas pela exportação diária completa. Para mais informações, consulte o artigo GA4 – BigQuery Export.
  • Contrato de nível de serviço (SLA) do GA4 360 para o BigQuery Export: Embora a framework Cortex não suporte as tabelas events_fresh_ criadas pelas exportações renovadas diariamente como tabelas de origem separadas, pode seguir os ##CORTEX-CUSTOMER comentários de personalização na vista de relatórios Events para substituir as tabelas de origem por estas, de modo a tirar partido do SLA fornecido por esta funcionalidade. Todas as vistas de relatórios vão continuar a funcionar após esta substituição.

Atualidade e atraso dos dados

Regra geral, a atualização dos dados das origens de dados do Cortex Framework é limitada pelo que a ligação a montante permite, bem como pela frequência de execução do DAG. Ajuste a frequência de execução do DAG para se alinhar com a frequência a montante, as restrições de recursos e as necessidades da sua empresa.

Com o Google Analytics 4, os dados do BigQuery Export podem sofrer um atraso de até um dia, consoante o seu fuso horário, a menos que esteja a usar a exportação renovada diariamente.

Configurações

Esta secção descreve as configurações do processo de dados.

Ligações do Cloud Composer

Crie as seguintes associações no Cloud Composer. Veja mais detalhes na documentação sobre a gestão de associações do Airflow.

Nome da associação Purpose
dv360_cdc_bq Para o conjunto de dados não processados > transferência do conjunto de dados da CDC.
dv360_reporting_bq Para o conjunto de dados da CDC > conjunto de dados de relatórios transferência.

Definições de relatórios

Pode configurar e controlar como o Cortex Framework gera dados para a camada de relatórios final do GA4 através do ficheiro de definições de relatórios src/GA4/config/reporting_settings.yaml. Este ficheiro controla a forma como os objetos do BigQuery da camada de relatórios (tabelas, vistas,funções ou procedimentos armazenados) são gerados.

Para mais informações, consulte o artigo Personalizar o ficheiro de definições de relatórios.

O que se segue?