Integração com o Google Analytics 4
Esta página descreve as configurações necessárias para trazer dados do Google Analytics 4 (GA4) como uma fonte de dados da carga de trabalho de marketing da Cortex Framework Data Foundation.
O GA4 é a versão mais recente do Google Analytics. Ele oferece uma visão holística do comportamento do usuário, com foco no acompanhamento baseado em eventos e no aprendizado de máquina para oferecer insights mais aprofundados. O Cortex Framework permite extrair dados do GA4 e integrá-los ao BigQuery para análises e relatórios mais detalhados. Você pode ter insights valiosos e gerar melhores resultados de negócios.
O diagrama a seguir descreve como os dados do GA4 estão disponíveis na carga de trabalho de marketing da Cortex Framework Data Foundation:
Arquivo de configuração
O arquivo config.json
configura as configurações necessárias para se conectar a fontes de dados para transferir
dados de várias cargas de trabalho. Esse arquivo contém os seguintes parâmetros para o GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
A tabela a seguir descreve o valor de cada parâmetro de marketing:
Parâmetro | Significado | Valor padrão | Descrição |
marketing.deployGA4
|
Implantar o GA4 | true
|
Execute a implantação para a fonte de dados do GA4. |
marketing.GA4.datasets.cdc
|
Conjuntos de dados do BigQuery Export para o GA4 | [{"property_id": 0, "name": ""}]
|
Matriz de conjuntos de dados do BigQuery do Google Analytics 4 Export. Cada elemento especifica Property ID como INT , bem como o nome do conjunto de dados de exportação do BigQuery correspondente.
|
marketing.GA4.datasets.reporting
|
Conjunto de dados de relatórios do GA4 | REPORTING_GA4
|
Conjunto de dados de relatórios do GA4. |
Modelo de dados
Esta seção descreve o modelo de dados do GA4 usando o diagrama de relacionamento de entidades (ERD, na sigla em inglês).
Visualizações básicas
Esses são os objetos azuis no ERD e são visualizações em tabelas de CDC com
transformações mínimas para descompactar estruturas de dados complexas. Consulte os scripts em
src/marketing/src/GA4/src/reporting/ddls
.
Visualizações de relatórios
Esses são os objetos verdes no ERD e são visualizações de relatórios que contêm métricas agregadas. Consulte os scripts em
src/marketing/src/GA4/src/reporting/ddls
.
Configurar a integração com o GA4
A base de dados do Cortex Framework se integra ao GA4 criando uma camada de relatórios sobre os conjuntos de dados de BigQuery Export do GA4 (tratados como conjuntos de dados do CDC na arquitetura do Cortex Framework). Isso é feito criando visualizações de execução em cima das tabelas do CDC ou executando DAGs do Cloud Composer para dados materializados nas tabelas do BigQuery, dependendo da configuração das configurações de relatórios.
Configurar o BigQuery Export do GA4
O Cortex Framework usa o recurso de exportação do BigQuery do GA4 para carregar dados do sistema de origem no BigQuery. Siga as instruções para configurar o BigQuery Export ou cada propriedade do GA4 neste artigo de ajuda do GA4: GA4: configurar o BigQuery Export.
Problemas conhecidos, limitações e outras considerações
Considere o seguinte ao configurar o BigQuery Export do GA4:
- Preenchimento: o BigQuery Export do GA4 começa a partir do dia em que é configurado e não há preenchimento.
- Diferença entre os números informados pela interface do GA4 e do Cortex Framework: vários fatores, incluindo, mas não se limitando a, amostragem, atraso na coleta de dados e relatórios de alta cardinalidade, podem causar pequenas discrepâncias entre a interface do Google Analytics e o Cortex Framework. Essa é uma limitação conhecida e inata do Google Analytics. Para mais informações, consulte Uma ponte entre a interface do Google Analytics e o BigQuery Export .
- Restrições de volume de exportação de eventos: dependendo da sua edição do Google Analytics, você pode enfrentar diferentes níveis de restrição de volume de exportação do BigQuery por dia. Para mais informações, consulte GA4: configurar o BigQuery Export.
- Fuso horário: na exportação do BigQuery,
event_date
é definido no fuso horário do relatório da propriedade, enquantoevent_timestamp
é o carimbo de data/hora UTC em microssegundos. Como resultado, seevent_timestamp
for usado, faça o ajuste para o fuso horário correto do relatório ao comparar com os números da interface. - Exportações diárias de eventos em vez de streaming (em tempo real): para exportações de eventos, o Cortex Framework só oferece suporte às tabelas
events_YYYYMMDD
criadas pela exportação diária completa. Para mais informações, consulte GA4: BigQuery Export. - Contrato de nível de serviço (SLA) do GA4 360 para o BigQuery Export:
embora o Cortex Framework não ofereça suporte às tabelas
events_fresh_
criadas pelas exportações diárias como tabelas de origem separadas, é possível seguir os comentários de personalização##CORTEX-CUSTOMER
na visualização de relatóriosEvents
para substituir as tabelas de origem por elas e aproveitar o SLA fornecido por esse recurso. Todas as visualizações de relatórios vão continuar funcionando após essa substituição.
Atualização e atraso de dados
Como regra geral, a atualidade dos dados para fontes de dados do Cortex Framework é limitada pelo que a conexão upstream permite, bem como pela frequência da execução da DAG. Ajuste a frequência de execução do DAG para estar alinhada à frequência upstream, às restrições de recursos e às necessidades da sua empresa.
Com o Google Analytics 4, os dados da exportação do BigQuery podem ter um atraso de até um dia, dependendo do seu fuso horário, a menos que você esteja usando a exportação diária com atualização.
Configurações
Esta seção descreve as configurações do processo de dados.
Conexões do Cloud Composer
Crie as seguintes conexões no Cloud Composer. Confira mais detalhes na documentação sobre como gerenciar conexões do Airflow.
Nome da conexão | Purpose |
dv360_cdc_bq
|
Para o conjunto de dados brutos > Transferência de conjunto de dados do CDC. |
dv360_reporting_bq
|
Para o conjunto de dados do CDC > Transferência de conjunto de dados de relatórios. |
Configurações de relatórios
É possível configurar e controlar como o Framework Cortex gera dados para a camada final de relatórios do GA4 usando o arquivo de configurações de relatórios src/GA4/config/reporting_settings.yaml
. Esse arquivo controla como os objetos do BigQuery da camada de relatórios (tabelas, visualizações,funções ou procedimentos armazenados) são gerados.
Para mais informações, consulte Como personalizar o arquivo de configurações de relatórios.
A seguir
- Para mais informações sobre outras fontes de dados e cargas de trabalho, consulte Fontes de dados e cargas de trabalho.
- Para mais informações sobre as etapas de implantação em ambientes de produção, consulte Pré-requisitos de implantação da base de dados do Cortex Framework.