Google Ads 통합
이 페이지에서는 Cortex Framework Data Foundation의 마케팅 워크로드 데이터 소스로 Google Ads의 데이터를 가져오는 데 필요한 구성을 설명합니다.
Google Ads는 비즈니스가 다양한 Google 서비스에서 제품 또는 서비스를 광고할 수 있는 온라인 광고 플랫폼입니다. Cortex Framework는 Google Ads 데이터를 다른 마케팅 채널과 통합하고 종합적으로 분석하며 AI를 사용하여 캠페인 결과를 개선합니다.
다음 다이어그램은 Cortex Framework Data Foundation의 마케팅 워크로드를 통해 Google Ads 데이터를 사용하는 방법을 설명합니다.
구성 파일
config.json
파일은 Google Ads를 비롯한 모든 데이터 소스에서 데이터를 전송하는 데 필요한 설정을 구성합니다. 이 파일에는 Google Ads의 다음 매개변수가 포함됩니다.
"marketing": {
"deployGoogleAds": true,
"GoogleAds": {
"deployCDC": true,
"lookbackDays": 180,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_GoogleAds"
}
}
}
다음 표에는 각 Google Ads 마케팅 매개변수의 값이 설명되어 있습니다.
매개변수 | 의미 | 기본값 | 설명 |
marketing.deployGoogleAds
|
Google Ads 배포 | true
|
Google Ads 데이터 소스의 배포를 실행합니다. |
marketing.GoogleAds.deployCDC
|
Google Ads용 CDC 배포 | true
|
Cloud Composer에서 DAG로 실행할 Google Ads CDC 처리 스크립트를 생성합니다. |
marketing.GoogleAds.lookbackDays
|
Google Ads의 전환 확인 기간 | 180
|
Google Ads API에서 데이터 가져오기를 시작하는 일 수입니다. |
marketing.GoogleAds.datasets.cdc
|
Google Ads용 CDC 데이터 세트 | Google Ads용 CDC 데이터 세트 | |
marketing.GoogleAds.datasets.raw
|
Google Ads의 원시 데이터 세트 | Google Ads의 원시 데이터 세트입니다. | |
marketing.GoogleAds.datasets.reporting
|
Google Ads 보고 데이터 세트 | "REPORTING_GoogleAds"
|
Google Ads 보고 데이터 세트 |
데이터 모델
이 섹션에서는 항목 관계 다이어그램 (ERD)을 사용하여 Google Ads 데이터 모델을 설명합니다.
기본 조회수
ERD의 파란색 객체이며 일부 열 이름 별칭 외에 변환이 없는 CDC 테이블의 뷰입니다. src/marketing/src/GoogleAds/src/reporting/ddls
에서 스크립트를 확인하세요.
보고 보기
ERD의 녹색 객체이며 집계 측정항목이 포함된 보고 뷰입니다. src/marketing/src/GoogleAds/src/reporting/ddls
에서 스크립트를 확인하세요.
API 연결
Cortex Framework 처리 템플릿은 Google Ads API를 사용하여 Google Ads에서 보고 속성과 측정항목을 가져옵니다. 현재 Cortex Framework 템플릿은 Google Ads API 버전 17.1을 사용합니다. Google Ads API 제한사항을 고려하세요.
- 일일 기본 액세스 작업: 15,000개 (유효한
next_page_token
가 포함된 페이징된 요청은 집계되지 않음) - 최대 페이지 크기: 페이지당 10,000개 행
- 권장 기본 매개변수: 페이지 크기는 페이지당 10,000행입니다.
API 연결에 관한 자세한 내용은 Google Ads API 문서를 참고하세요.
계정 인증
계정 인증을 설정하려면 다음 단계를 따르세요.
- Google Cloud 콘솔에서 탐색 메뉴 > API 및 서비스 > 사용자 인증 정보 > 사용자 인증 정보 만들기를 클릭합니다.
다음과 같은 특성을 가진 OAuth 클라이언트 ID 사용자 인증 정보를 만듭니다. 자세한 내용은 OAuth 2.0을 사용하여 Google API에 액세스하기를 참고하세요.
Application type: "Web Application" Name: CHOSEN_NAME #(For example,"Cortex Authentication Client"). Authorized redirect URIs: http://127.0.0.1
CHOSEN_NAME
을 OAuth 클라이언트 ID 사용자 인증 정보 계정에 선택한 이름으로 바꿉니다.사용자 인증 정보가 구성된 후
Client ID
및Client secret
를 저장합니다. 이 값은 나중에 필요합니다.OAuth 2.0 Access Google APIs를 사용하여 새 토큰을 생성합니다. Cortex Data Foundation은 토큰 생성에 사용된 사용자 인증 정보에 액세스할 수 있는 모든 고객(계정)의 데이터를 자동으로 감지하고 처리합니다.
Secret Manager를 사용하여 보안 비밀을 만듭니다.
- Google Cloud 콘솔에서 Secret Manager를 클릭합니다.
- 다음 형식을 사용하여
cortex-framework-google-ads-yaml
라는 보안 비밀을 만들고 설정에 따라 값을 변경합니다.
{"developer_token": "DEVELOPER_TOKEN_VALUE", "refresh_token": "REFRESH_TOKEN_VALUE", "client_id": "CLIENT_ID_VALUE", "client_secret": "CLIENT_SECRET_VALUE", "use_proto_plus": False}
다음을 바꿉니다.
- Google Ads 계정에서 사용할 수 있는 개발자 토큰 값이 포함된
DEVELOPER_TOKEN_VALUE
REFRESH_TOKEN_VALUE
을 4단계에서 가져온 갱신 토큰 값으로 바꿉니다.CLIENT_ID_VALUE
를 2단계의 OAuth 설정에서 가져온 클라이언트 ID 값으로 바꿉니다.CLIENT_SECRET_VALUE
를 2단계의 OAuth 설정에서 가져온 클라이언트 보안 비밀번호 값으로 바꿉니다.
데이터 최신 상태 및 지연
일반적으로 Cortex Framework 데이터 소스의 데이터 최신성은 업스트림 연결에서 허용하는 사항과 DAG 실행 빈도에 따라 제한됩니다. 업스트림 빈도, 리소스 제약조건, 비즈니스 요구사항에 맞게 DAG 실행 빈도를 조정합니다.
Google Ads API를 사용하여 가져온 데이터는 일반적으로 3시간 이상의 지연 시간이 있습니다. 전환 및 무효 트래픽 감지로 인해 나중에 조정될 수 있습니다. 자세한 내용은 Google Ads 고객센터의 다음 데이터 최신성 정보 도움말을 참고하세요.
Cloud Composer 연결 권한
Cloud Composer에서 다음 연결을 만듭니다. 자세한 내용은 Airflow 연결 관리 문서를 참고하세요.
연결 이름 | 목적 |
googleads_raw_dataflow
|
Google Ads API > BigQuery 원시 데이터 세트 |
googleads_cdc_bq
|
원시 데이터 세트 > CDC 데이터 세트 전송 |
googleads_reporting_bq
|
CDC 데이터 세트 > 보고 데이터 세트 전송 |
Cloud Composer 서비스 계정 권한
Cloud Composer에서 사용되는 서비스 계정 (googleads_raw_dataflow
연결에 구성됨)에 Dataflow 권한을 부여합니다. Dataflow 문서의 안내를 참고하세요.
처리 설정
src/GoogleAds/config/ingestion_settings.yaml
파일의 설정을 통해 Source to Raw
및 Raw to CDC
데이터 파이프라인을 제어합니다. 이 섹션에서는 각 데이터 파이프라인의 매개변수를 설명합니다.
원시 테이블의 소스
이 섹션에서는 API에서 가져오는 항목과 가져오는 방법을 설명합니다. 각 항목은 하나의 Google Ads 항목에 해당합니다. 이 구성을 기반으로 Cortex는 Dataflow 파이프라인을 실행하여 Google Ads API를 사용하여 데이터를 가져오는 Airflow DAG를 만듭니다.
다음 매개변수는 각 항목의 Source to Raw
설정을 제어합니다.
매개변수 | 설명 |
load_frequency
|
이 항목의 DAG가 Google Ads에서 데이터를 가져오기 위해 실행되는 빈도입니다. 가능한 값에 관한 자세한 내용은 Airflow 문서를 참고하세요. |
api_name
|
API 리소스 이름 (예: customer )
|
table_name
|
가져온 데이터가 저장되는 원시 데이터 세트의 테이블입니다 (예: customer ).
|
schema_file
|
API 응답 필드를 대상 테이블의 열 이름에 매핑하는 src/table_schema 디렉터리의 스키마 파일입니다.
|
key
|
이 테이블의 고유한 레코드를 형성하는 열 (쉼표로 구분됨)입니다. |
is_metrics_table
|
지정된 항목이 측정항목 항목인지 여부를 나타냅니다 (Google Ads API). 시스템은 이러한 테이블의 집계된 특성으로 인해 이러한 테이블을 약간 다르게 처리합니다. |
partition_details
|
선택사항: 성능 고려사항으로 인해 이 테이블을 파티션화하려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능 고려사항으로 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
원시 테이블에서 CDC 테이블로
이 섹션에서는 데이터가 원시 테이블에서 CDC 테이블로 이동하는 방식을 제어하는 항목을 설명합니다. 각 항목은 원시 테이블에 해당하며 이는 앞서 언급한 대로 Google Ads API 항목에 해당합니다.
다음 매개변수는 각 항목의 Raw to CDC
설정을 제어합니다.
매개변수 | 설명 |
table_name
|
CDC 변환 후 원시 데이터가 저장되는 CDC 데이터 세트의 테이블입니다 (예: customer ).
|
raw_table
|
원시 데이터가 복제된 테이블입니다. |
key
|
이 테이블의 고유한 레코드를 형성하는 열 (쉼표로 구분됨) |
load_frequency
|
이 항목의 DAG가 CDC 테이블을 채우기 위해 실행되는 빈도입니다. 가능한 값에 관한 자세한 내용은 Airflow 문서를 참고하세요. |
schema_file
|
원시 열을 CDC 열에 매핑하고 CDC 열의 데이터 유형을 지정하는 src/table_schema 디렉터리의 스키마 파일입니다.
이는 이전 섹션에서 참조된 것과 동일한 스키마 파일입니다.
|
partition_details
|
선택사항: 성능 고려사항으로 인해 이 테이블을 파티션화하려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능 고려사항으로 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
보고서 설정
보고 설정 파일 src/GoogleAds/config/reporting_settings.yaml
를 사용하여 Cortex Framework가 Google Ads 최종 보고 영역의 데이터를 생성하는 방식을 구성하고 제어할 수 있습니다.
이 파일은 보고 레이어 BigQuery 객체(테이블, 뷰,함수 또는 저장 프로시저)가 생성되는 방식을 제어합니다.
자세한 내용은 보고서 설정 파일 맞춤설정을 참고하세요.
다음 단계
- 다른 데이터 소스 및 워크로드에 관한 자세한 내용은 데이터 소스 및 워크로드를 참고하세요.
- 프로덕션 환경에서 배포하는 단계에 관한 자세한 내용은 Cortex Framework Data Foundation 배포 기본 요건을 참고하세요.