Integração com o Google Analytics 4

Esta página descreve as configurações necessárias para trazer dados do Google Analytics 4 (GA4) como uma fonte de dados da carga de trabalho de marketing da Cortex Framework Data Foundation.

O GA4 é a versão mais recente do Google Analytics. Ele oferece uma visão holística do comportamento do usuário, com foco no acompanhamento baseado em eventos e no aprendizado de máquina para oferecer insights mais aprofundados. O Cortex Framework permite extrair dados do GA4 e integrá-los ao BigQuery para análises e relatórios mais detalhados. Você pode ter insights valiosos e gerar melhores resultados de negócios.

O diagrama a seguir descreve como os dados do GA4 estão disponíveis na carga de trabalho de marketing da Cortex Framework Data Foundation:

Origem de dados do GA4

Figura 1. Fonte de dados do GA4.

Arquivo de configuração

O arquivo config.json configura as configurações necessárias para se conectar a fontes de dados para transferir dados de várias cargas de trabalho. Esse arquivo contém os seguintes parâmetros para o GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

A tabela a seguir descreve o valor de cada parâmetro de marketing:

Parâmetro Significado Valor padrão Descrição
marketing.deployGA4 Implantar o GA4 true Execute a implantação para a fonte de dados do GA4.
marketing.GA4.datasets.cdc Conjuntos de dados do BigQuery Export para o GA4 [{"property_id": 0, "name": ""}] Matriz de conjuntos de dados do BigQuery do Google Analytics 4 Export. Cada elemento especifica Property ID como INT, bem como o nome do conjunto de dados de exportação do BigQuery correspondente.
marketing.GA4.datasets.reporting Conjunto de dados de relatórios do GA4 REPORTING_GA4 Conjunto de dados de relatórios do GA4.

Modelo de dados

Esta seção descreve o modelo de dados do GA4 usando o diagrama de relacionamento de entidades (ERD, na sigla em inglês).

Diagrama de relacionamento de entidades do GA4

Figura 2. GA4: diagrama de relacionamento de entidades.

Visualizações básicas

Esses são os objetos azuis no ERD e são visualizações em tabelas de CDC com transformações mínimas para descompactar estruturas de dados complexas. Consulte os scripts em src/marketing/src/GA4/src/reporting/ddls.

Visualizações de relatórios

Esses são os objetos verdes no ERD e são visualizações de relatórios que contêm métricas agregadas. Consulte os scripts em src/marketing/src/GA4/src/reporting/ddls.

Configurar a integração com o GA4

A base de dados do Cortex Framework se integra ao GA4 criando uma camada de relatórios sobre os conjuntos de dados de BigQuery Export do GA4 (tratados como conjuntos de dados do CDC na arquitetura do Cortex Framework). Isso é feito criando visualizações de execução em cima das tabelas do CDC ou executando DAGs do Cloud Composer para dados materializados nas tabelas do BigQuery, dependendo da configuração das configurações de relatórios.

Configurar o BigQuery Export do GA4

O Cortex Framework usa o recurso de exportação do BigQuery do GA4 para carregar dados do sistema de origem no BigQuery. Siga as instruções para configurar o BigQuery Export ou cada propriedade do GA4 neste artigo de ajuda do GA4: GA4: configurar o BigQuery Export.

Problemas conhecidos, limitações e outras considerações

Considere o seguinte ao configurar o BigQuery Export do GA4:

  • Preenchimento: o BigQuery Export do GA4 começa a partir do dia em que é configurado e não há preenchimento.
  • Diferença entre os números informados pela interface do GA4 e do Cortex Framework: vários fatores, incluindo, mas não se limitando a, amostragem, atraso na coleta de dados e relatórios de alta cardinalidade, podem causar pequenas discrepâncias entre a interface do Google Analytics e o Cortex Framework. Essa é uma limitação conhecida e inata do Google Analytics. Para mais informações, consulte Uma ponte entre a interface do Google Analytics e o BigQuery Export .
  • Restrições de volume de exportação de eventos: dependendo da sua edição do Google Analytics, você pode enfrentar diferentes níveis de restrição de volume de exportação do BigQuery por dia. Para mais informações, consulte GA4: configurar o BigQuery Export.
  • Fuso horário: na exportação do BigQuery, event_date é definido no fuso horário do relatório da propriedade, enquanto event_timestamp é o carimbo de data/hora UTC em microssegundos. Como resultado, se event_timestamp for usado, faça o ajuste para o fuso horário correto do relatório ao comparar com os números da interface.
  • Exportações diárias de eventos em vez de streaming (em tempo real): para exportações de eventos, o Cortex Framework só oferece suporte às tabelas events_YYYYMMDD criadas pela exportação diária completa. Para mais informações, consulte GA4: BigQuery Export.
  • Contrato de nível de serviço (SLA) do GA4 360 para o BigQuery Export: embora o Cortex Framework não ofereça suporte às tabelas events_fresh_ criadas pelas exportações diárias como tabelas de origem separadas, é possível seguir os comentários de personalização ##CORTEX-CUSTOMER na visualização de relatórios Events para substituir as tabelas de origem por elas e aproveitar o SLA fornecido por esse recurso. Todas as visualizações de relatórios vão continuar funcionando após essa substituição.

Atualização e atraso de dados

Como regra geral, a atualidade dos dados para fontes de dados do Cortex Framework é limitada pelo que a conexão upstream permite, bem como pela frequência da execução da DAG. Ajuste a frequência de execução do DAG para estar alinhada à frequência upstream, às restrições de recursos e às necessidades da sua empresa.

Com o Google Analytics 4, os dados da exportação do BigQuery podem ter um atraso de até um dia, dependendo do seu fuso horário, a menos que você esteja usando a exportação diária com atualização.

Configurações

Esta seção descreve as configurações do processo de dados.

Conexões do Cloud Composer

Crie as seguintes conexões no Cloud Composer. Confira mais detalhes na documentação sobre como gerenciar conexões do Airflow.

Nome da conexão Purpose
dv360_cdc_bq Para o conjunto de dados brutos > Transferência de conjunto de dados do CDC.
dv360_reporting_bq Para o conjunto de dados do CDC > Transferência de conjunto de dados de relatórios.

Configurações de relatórios

É possível configurar e controlar como o Framework Cortex gera dados para a camada final de relatórios do GA4 usando o arquivo de configurações de relatórios src/GA4/config/reporting_settings.yaml. Esse arquivo controla como os objetos do BigQuery da camada de relatórios (tabelas, visualizações,funções ou procedimentos armazenados) são gerados.

Para mais informações, consulte Como personalizar o arquivo de configurações de relatórios.

A seguir