TikTok 통합
이 페이지에서는 TikTok의 데이터를 Cortex Framework Data Foundation의 마케팅 워크로드 데이터 소스로 가져오는 데 필요한 구성을 설명합니다.
TikTok은 짧은 형식의 동영상으로 유명한 인기 소셜 미디어 앱으로, Cortex Framework에서 데이터를 가져와 전반적인 마케팅 실적을 분석할 수 있습니다. TikTok의 데이터와 다양한 소스의 데이터를 결합하면 다양한 플랫폼에서 타겟 잠재고객과 소셜 미디어 캠페인의 효과를 더 포괄적으로 파악할 수 있습니다.
다음 다이어그램은 Cortex Framework Data Foundation의 마케팅 워크로드를 통해 TikTok 데이터를 사용하는 방법을 설명합니다.
구성 파일
config.json
파일은 다양한 워크로드에서 데이터를 전송하기 위해 데이터 소스에 연결하는 데 필요한 설정을 구성합니다. 이 파일에는 TikTok의 다음 매개변수가 포함됩니다.
"marketing": {
"deployTikTok": true,
},
"TikTok": {
"deployCDC": true,
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_TikTok"
}
}
다음 표에는 각 마케팅 매개변수의 값이 설명되어 있습니다.
매개변수 | 의미 | 기본값 | 설명 |
marketing.deployTikTok
|
TikTok 배포 | true
|
TikTok 데이터 소스의 배포를 실행합니다. |
marketing.TikTok.deployCDC
|
TikTok용 CDC 스크립트 배포 | true
|
Cloud Composer에서 DAG로 실행할 TikTok CDC 처리 스크립트를 생성합니다. |
marketing.TikTok.datasets.cdc
|
TikTok용 CDC 데이터 세트 | TikTok용 CDC 데이터 세트 | |
marketing.TikTok.datasets.raw
|
TikTok용 원시 데이터 세트 | TikTok의 원시 데이터 세트입니다. | |
marketing.TikTok.datasets.reporting
|
TikTok 보고 데이터 세트 | "REPORTING_TikTok"
|
TikTok의 보고 데이터 세트입니다. |
데이터 모델
이 섹션에서는 엔터티 관계 다이어그램 (ERD)을 사용하여 TikTok 데이터 모델을 설명합니다.
기본 조회수
ERD의 파란색 객체이며 일부 열 이름 별칭 외에 변환이 없는 CDC 테이블의 뷰입니다. src/marketing/src/TikTok/src/reporting/ddls
에서 스크립트를 확인하세요.
보고 보기
ERD의 녹색 객체이며 집계 측정항목이 포함된 보고 뷰입니다. src/marketing/src/TikTok/src/reporting/ddls
에서 스크립트를 확인하세요.
API 연결
Cortex Framework는 TikTok 데이터의 공신력 있는 소스로 TikTok Reporting API 버전 v1.3을 사용합니다. Cortex Framework는 동기식 모드를 사용하고 기본 보고 API를 호출하여 광고 및 광고 그룹의 실적 측정항목을 가져옵니다. 이를 통해 Cortex Framework는 TikTok의 최신 정확한 정보에 액세스하여 효과적인 데이터 분석 및 보고를 할 수 있습니다.
API 연결에 관한 자세한 내용은 TikTok Reporting API를 참고하세요.
계정 인증
TikTok 계정 및 계정 인증을 구성하려면 다음 단계를 따르세요.
- TikTok 개발자 계정이 없는 경우 설정합니다.
- Cortex Framework 통합을 위한 앱을 만듭니다. 자세한 내용은 비즈니스용 TikTok API를 참고하세요. 앱 범위에서 다음 두 가지를 선택해야 합니다.
Ad Account Management/Ad Account Information
Reporting/All
- TikTok 가이드에 설명된 대로 앱 ID, 비밀번호, 장기 액세스 토큰을 가져와 다음 이름으로 Secret Manager에 각각 저장합니다.
- 앱 ID:
cortex_tiktok_app_id
- Secret:
cortex_tiktok_app_secret
- 장기 액세스 토큰:
cortex_tiktok_access_token
- 앱 ID:
데이터 최신 상태 및 지연
일반적으로 Cortex Framework 데이터 소스의 데이터 최신성은 업스트림 연결에서 허용하는 사항과 DAG 실행 빈도에 따라 제한됩니다. 업스트림 빈도, 리소스 제약조건, 비즈니스 요구사항에 맞게 DAG 실행 빈도를 조정합니다.
TikTok Marketing API를 사용하면 대부분의 데이터 (전환 제외)를 거의 실시간으로 사용할 수 있습니다.
Cloud Composer 연결
Cloud Composer에서 다음 연결을 만듭니다. 자세한 내용은 Airflow 연결 관리 문서를 참고하세요.
연결 이름 | 목적 |
tiktok_raw_dataflow
|
TikTok API > BigQuery 원시 데이터 세트 |
tiktok_cdc_bq
|
원시 데이터 세트 > CDC 데이터 세트 전송 |
tiktok_reporting_bq
|
CDC 데이터 세트 > 보고 데이터 세트 전송 |
Cloud Composer 서비스 계정 권한
Cloud Composer에서 사용되는 서비스 계정 (tiktok_raw_dataflow
연결에 구성됨)에 Dataflow 권한을 부여합니다.
Dataflow 문서의 안내를 참고하세요.
또한 동일한 서비스 계정에 Secret Manager 액세스 권한도 있어야 합니다.
처리 설정
src/TikTok/config/ingestion_settings.yaml
파일의 설정을 통해 Source to Raw
및 Raw to CDC
데이터 파이프라인을 제어합니다. 이 섹션에서는 각 데이터 파이프라인의 매개변수를 설명합니다.
원시 테이블의 소스
이 섹션에는 TikTok의 데이터를 가져오는 방법과 원시 데이터 세트에서 데이터가 최종적으로 저장되는 위치를 제어하는 항목이 있습니다. 각 항목은 해당 항목의 데이터가 TikTok API에서 가져온 원시 테이블 1개와 일치합니다. 이 구성 매개변수를 기반으로 Cortex Framework는 Dataflow 파이프라인을 실행하여 TikTok API의 데이터를 처리하는 Airflow DAG를 만듭니다.
다음 매개변수는 각 항목의 Source to Raw
설정을 제어합니다.
매개변수 | 설명 |
base_table
|
항목의 데이터가 저장되는 원시 데이터 세트의 테이블입니다(예: '광고' 데이터). |
load_frequency
|
이 항목에서 데이터를 처리하기 위해 DAG가 실행되는 빈도입니다. 가능한 값에 관한 자세한 내용은 Airflow 문서를 참고하세요. |
schema_file
|
API 응답 필드를 대상 테이블의 열 이름에 매핑하는 src/table_schema 디렉터리의 스키마 파일입니다.
|
partition_details
|
선택사항: 성능 고려사항으로 인해 이 테이블을 파티션화하려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능 고려사항으로 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
원시 테이블에서 CDC 테이블로
이 섹션에는 데이터가 원시 테이블에서 CDC 테이블로 이동하는 방식을 제어하는 항목이 있습니다. 각 항목은 CDC 테이블에 해당하며 이는 Source to Raw table
에 언급된 항목에 해당합니다.
다음 매개변수는 각 항목의 Raw to CDC
설정을 제어합니다.
매개변수 | 설명 |
base_table
|
CDC 변환 후 원시 데이터가 저장되는 CDC 데이터 세트의 테이블입니다 (예:auction_ad_performance ).
|
load_frequency
|
이 항목의 DAG가 CDC 테이블을 채우기 위해 실행되는 빈도입니다. 가능한 값에 관한 자세한 내용은 Airflow 문서를 참고하세요. |
row_identifiers
|
이 테이블의 고유한 레코드를 형성하는 열 목록 (쉼표로 구분됨)입니다. |
partition_details
|
선택사항: 성능 고려사항으로 인해 이 테이블을 파티션화하려는 경우 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능 고려사항으로 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
보고서 설정
보고 설정 파일 src/TikTok/config/reporting_settings.yaml
을 사용하여 Cortex Framework가 TikTok 최종 보고 레이어의 데이터를 생성하는 방식을 구성하고 제어합니다.
이 파일은 보고 레이어 BigQuery 객체(테이블, 뷰, 함수 또는 저장 프로시저)가 생성되는 방식을 제어합니다.
자세한 내용은 보고서 설정 파일 맞춤설정을 참고하세요.
다음 단계
- 다른 데이터 소스 및 워크로드에 관한 자세한 내용은 데이터 소스 및 워크로드를 참고하세요.
- 프로덕션 환경에서 배포하는 단계에 관한 자세한 내용은 Cortex Framework Data Foundation 배포 기본 요건을 참고하세요.