Integração com o Google Analytics 4
Esta página descreve as configurações necessárias para importar dados do Google Analytics 4 (GA4) como origem de dados da carga de trabalho de marketing da base de dados do Cortex Framework.
O GA4 é a versão mais recente do Google Analytics. Oferece uma vista holística do comportamento do utilizador, focando-se na monitorização baseada em eventos e na aprendizagem automática para oferecer estatísticas mais detalhadas. A framework Cortex permite-lhe extrair dados do GA4 e integrá-los no BigQuery para análise e relatórios adicionais. Pode obter estatísticas valiosas e gerar melhores resultados de negócio.
O diagrama seguinte descreve como os dados do GA4 estão disponíveis através da carga de trabalho de marketing da base de dados do Cortex Framework:
Ficheiro de configuração
O ficheiro config.json
configura as definições necessárias para estabelecer ligação a origens de dados para transferir
dados de várias cargas de trabalho. Este ficheiro contém os seguintes parâmetros para o GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
A tabela seguinte descreve o valor de cada parâmetro de marketing:
Parâmetro | Significado | Valor predefinido | Descrição |
marketing.deployGA4
|
Implemente o GA4 | true
|
Execute a implementação para a origem de dados do GA4. |
marketing.GA4.datasets.cdc
|
Conjuntos de dados do BigQuery Export para o GA4 | [{"property_id": 0, "name": ""}]
|
Matriz de conjuntos de dados do BigQuery do Google Analytics 4. Cada elemento especifica Property ID como
INT , bem como o nome do conjunto de dados do BigQuery Export correspondente.
|
marketing.GA4.datasets.reporting
|
Conjunto de dados de relatórios para o GA4 | REPORTING_GA4
|
Conjunto de dados de relatórios para o GA4. |
Modelo de dados
Esta secção descreve o modelo de dados do GA4 através do diagrama de relação entre entidades (ERD).
Visualizações de base
Estes são os objetos azuis no DER e são vistas em tabelas de CDC com transformações mínimas para descompactar estruturas de dados complexas. Veja guiões em
src/marketing/src/GA4/src/reporting/ddls
.
Visualizações de propriedade de relatórios
Estes são os objetos verdes no DER e são vistas de relatórios que contêm métricas agregadas. Veja guiões em
src/marketing/src/GA4/src/reporting/ddls
.
Configure a integração para o GA4
A base de dados do Cortex Framework integra-se com o GA4 através da criação de uma camada de relatórios sobre os conjuntos de dados do BigQuery Export do GA4 (tratados como conjuntos de dados de CDC na arquitetura do Cortex Framework). Isto é feito através da criação de visualizações de tempo de execução com base em tabelas de CDC ou da execução de DAGs do Cloud Composer para dados materializados em tabelas do BigQuery, consoante a configuração das definições de relatórios.
Configure o BigQuery Export do GA4
A framework Cortex usa a funcionalidade BigQuery Export do GA4 para carregar dados do sistema de origem para o BigQuery. Siga as instruções para configurar o BigQuery Export para cada propriedade do GA4 neste artigo de ajuda do GA4: GA4 – Configure o BigQuery Export.
Problemas conhecidos, limitações e outras considerações
Tenha em atenção o seguinte ao configurar o BigQuery Export do GA4:
- Preenchimento: o BigQuery Export do GA4 começa no dia em que é configurado e não existe preenchimento.
- Diferença entre a IU do GA4 e os números comunicados pela framework Cortex: Vários fatores, incluindo, entre outros, a amostragem, o atraso na recolha de dados e os relatórios de elevada cardinalidade, podem causar uma pequena discrepância entre a IU do Google Analytics e a framework Cortex. Esta é uma limitação conhecida e inerente do Google Analytics. Para mais informações, consulte o artigo Aproximar a IU do Google Analytics e o BigQuery Export .
- Restrições de volume de exportação de eventos: consoante a sua edição do Google Analytics, pode enfrentar vários graus de restrição de volume de exportação do BigQuery por dia. Para mais informações, consulte o artigo GA4 – Configure o BigQuery Export.
- Fuso horário: no BigQuery Export, o valor
event_date
é definido no fuso horário dos relatórios da propriedade, enquanto o valorevent_timestamp
é a data/hora UTC em microssegundos. Como resultado, seevent_timestamp
for usado, certifique-se de que faz o ajuste para o fuso horário de relatórios correto quando comparar com os números da IU. - Exportações de eventos diárias versus com streaming (em tempo real): para exportações de eventos, a estrutura do Cortex só suporta as tabelas
events_YYYYMMDD
criadas pela exportação diária completa. Para mais informações, consulte o artigo GA4 – BigQuery Export. - Contrato de nível de serviço (SLA) do GA4 360 para o BigQuery Export:
Embora a framework Cortex não suporte as tabelas
events_fresh_
criadas pelas exportações renovadas diariamente como tabelas de origem separadas, pode seguir os##CORTEX-CUSTOMER
comentários de personalização na vista de relatóriosEvents
para substituir as tabelas de origem por estas, de modo a tirar partido do SLA fornecido por esta funcionalidade. Todas as vistas de relatórios vão continuar a funcionar após esta substituição.
Atualidade e atraso dos dados
Regra geral, a atualização dos dados das origens de dados do Cortex Framework é limitada pelo que a ligação a montante permite, bem como pela frequência de execução do DAG. Ajuste a frequência de execução do DAG para se alinhar com a frequência a montante, as restrições de recursos e as necessidades da sua empresa.
Com o Google Analytics 4, os dados do BigQuery Export podem sofrer um atraso de até um dia, consoante o seu fuso horário, a menos que esteja a usar a exportação renovada diariamente.
Configurações
Esta secção descreve as configurações do processo de dados.
Ligações do Cloud Composer
Crie as seguintes associações no Cloud Composer. Veja mais detalhes na documentação sobre a gestão de associações do Airflow.
Nome da associação | Purpose |
dv360_cdc_bq
|
Para o conjunto de dados não processados > transferência do conjunto de dados da CDC. |
dv360_reporting_bq
|
Para o conjunto de dados da CDC > conjunto de dados de relatórios transferência. |
Definições de relatórios
Pode configurar e controlar como o Cortex Framework gera dados para a camada de relatórios final do GA4 através do ficheiro de definições de relatórios src/GA4/config/reporting_settings.yaml
. Este ficheiro controla a forma como os objetos do BigQuery da camada de relatórios (tabelas, vistas,funções ou procedimentos armazenados) são gerados.
Para mais informações, consulte o artigo Personalizar o ficheiro de definições de relatórios.
O que se segue?
- Para mais informações sobre outras origens de dados e cargas de trabalho, consulte o artigo Origens de dados e cargas de trabalho.
- Para mais informações sobre os passos de implementação em ambientes de produção, consulte os Pré-requisitos de implementação da base de dados do Cortex Framework.