Google 애널리틱스 4와 통합
이 페이지에서는 Google 애널리틱스 4 (GA4)의 데이터를 Cortex Framework Data Foundation의 마케팅 워크로드 데이터 소스로 가져오기 위해 필요한 구성을 설명합니다.
GA4는 Google 애널리틱스의 최신 버전입니다. 이벤트 기반 추적 및 머신러닝에 중점을 두어 사용자 행동을 종합적으로 파악하고 더 깊은 통계를 제공합니다. Cortex Framework를 사용하면 GA4에서 데이터를 추출하여 BigQuery에 통합하여 추가 분석 및 보고를 수행할 수 있습니다. 가치 있는 정보를 얻고 비즈니스 성과를 개선할 수 있습니다.
다음 다이어그램은 Cortex Framework Data Foundation의 마케팅 워크로드를 통해 GA4 데이터를 사용하는 방법을 설명합니다.
구성 파일
config.json
파일은 다양한 워크로드에서 데이터를 전송하기 위해 데이터 소스에 연결하는 데 필요한 설정을 구성합니다. 이 파일에는 GA4의 다음 매개변수가 포함되어 있습니다.
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
다음 표에는 각 마케팅 매개변수의 값이 설명되어 있습니다.
매개변수 | 의미 | 기본값 | 설명 |
marketing.deployGA4
|
GA4 배포 | true
|
GA4 데이터 소스의 배포를 실행합니다. |
marketing.GA4.datasets.cdc
|
GA4용 BigQuery 내보내기 데이터 세트 | [{"property_id": 0, "name": ""}]
|
Google 애널리틱스 4 BigQuery Export 데이터 세트 배열입니다. 각 요소는 Property ID 를 INT 로 지정하고 이에 상응하는 BigQuery 내보내기 데이터 세트 이름을 지정합니다.
|
marketing.GA4.datasets.reporting
|
GA4 보고 데이터 세트 | REPORTING_GA4
|
GA4의 보고 데이터 세트입니다. |
데이터 모델
이 섹션에서는 항목 관계 다이어그램 (ERD)을 사용하여 GA4 데이터 모델을 설명합니다.
기본 조회수
ERD의 파란색 객체이며 복잡한 데이터 구조를 압축 해제하기 위한 최소한의 변환이 적용된 CDC 테이블의 뷰입니다. src/marketing/src/GA4/src/reporting/ddls
에서 스크립트를 확인하세요.
보고 보기
ERD의 녹색 객체이며 집계 측정항목이 포함된 보고 뷰입니다. src/marketing/src/GA4/src/reporting/ddls
에서 스크립트를 확인하세요.
GA4 통합 구성
Cortex Framework 데이터 기반은 GA4의 BigQuery Export 데이터 세트 (Cortex Framework 아키텍처에서 CDC 데이터 세트로 취급됨) 위에 보고서 레이어를 만들어 GA4와 통합됩니다. 이는 보고서 설정 구성에 따라 CDC 테이블 위에 런타임 뷰를 만들거나 BigQuery 테이블의 구체화된 데이터에 대해 Cloud Composer DAG를 실행하여 실행됩니다.
GA4 BigQuery Export 설정
Cortex Framework는 GA4의 BigQuery Export 기능을 사용하여 소스 시스템에서 BigQuery로 데이터를 로드합니다. 이 GA4 도움말 GA4 - BigQuery Export 설정에서 BigQuery Export 또는 각 GA4 속성을 설정하는 방법을 따르세요.
알려진 문제, 제한사항, 기타 고려사항
GA4 BigQuery Export를 설정할 때는 다음 사항을 고려하세요.
- 백필: GA4 BigQuery Export는 설정된 날짜부터 시작되며 백필은 없습니다.
- GA4 UI와 Cortex Framework의 보고된 수치 차이: 샘플링, 데이터 수집 지연, 카디널리티가 높은 보고서 등 여러 요인으로 인해 Google 애널리틱스 UI와 Cortex Framework 간에 약간의 불일치가 발생할 수 있습니다. 이는 Google 애널리틱스의 알려진 기본 제한사항입니다. 자세한 내용은 Google 애널리틱스 UI와 BigQuery 내보내기 간의 격차 줄이기 를 참고하세요.
- 이벤트 내보내기 양 제한: Google 애널리틱스 버전에 따라 BigQuery 내보내기 양 제한이 일별로 다를 수 있습니다. 자세한 내용은 GA4 - BigQuery Export 설정하기를 참고하세요.
- 시간대: BigQuery 내보내기에서
event_date
는 속성의 보고 시간대에 설정되고event_timestamp
는 마이크로초 단위의 UTC 타임스탬프입니다. 따라서event_timestamp
를 사용하는 경우 UI 번호와 비교할 때 올바른 보고 시간대로 조정해야 합니다. - 일일 이벤트 내보내기와 스트리밍 (실시간) 이벤트 내보내기 비교: 이벤트 내보내기의 경우 Cortex Framework는 전체 일일 내보내기로 생성된
events_YYYYMMDD
테이블만 지원합니다. 자세한 내용은 GA4 - BigQuery 내보내기를 참고하세요. - BigQuery Export용 GA4 360 서비스수준계약 (SLA):
Cortex Framework는 일일 업데이트 내보내기로 생성된
events_fresh_
테이블을 별도의 소스 테이블로 지원하지 않지만,Events
보고 뷰의##CORTEX-CUSTOMER
맞춤설정 주석에 따라 소스 테이블을events_fresh_
테이블로 대체하여 이 기능에서 제공하는 SLA를 활용할 수 있습니다. 이 대체 후에도 모든 보고 보기는 계속 작동합니다.
데이터 최신 상태 및 지연
일반적으로 Cortex Framework 데이터 소스의 데이터 최신성은 업스트림 연결에서 허용하는 사항과 DAG 실행 빈도에 따라 제한됩니다. 업스트림 빈도, 리소스 제약조건, 비즈니스 요구사항에 맞게 DAG 실행 빈도를 조정합니다.
Google 애널리틱스 4에서는 일일 업데이트 내보내기를 사용하지 않는 한 BigQuery 내보내기 데이터가 시간대에 따라 최대 하루까지 지연될 수 있습니다.
구성
이 섹션에서는 데이터 프로세스의 구성을 설명합니다.
Cloud Composer 연결
Cloud Composer에서 다음 연결을 만듭니다. 자세한 내용은 Airflow 연결 관리 문서를 참고하세요.
연결 이름 | 목적 |
dv360_cdc_bq
|
원시 데이터 세트 > CDC 데이터 세트 전송 |
dv360_reporting_bq
|
CDC 데이터 세트 > 보고 데이터 세트 전송 |
보고서 설정
보고 설정 파일 src/GA4/config/reporting_settings.yaml
를 사용하여 Cortex Framework가 GA4 최종 보고 영역의 데이터를 생성하는 방식을 구성하고 제어할 수 있습니다. 이 파일은 보고 레이어 BigQuery 객체(테이블, 뷰,함수 또는 저장 프로시저)가 생성되는 방식을 제어합니다.
자세한 내용은 보고서 설정 파일 맞춤설정을 참고하세요.
다음 단계
- 다른 데이터 소스 및 워크로드에 관한 자세한 내용은 데이터 소스 및 워크로드를 참고하세요.
- 프로덕션 환경에서 배포하는 단계에 관한 자세한 내용은 Cortex Framework Data Foundation 배포 기본 요건을 참고하세요.