Salesforce Marketing Cloud 통합
이 페이지에서는 Salesforce Marketing Cloud (SFMC)의 데이터를 Cortex Framework Data Foundation의 마케팅 워크로드 데이터 소스로 가져오는 데 필요한 구성을 설명합니다.
SFMC는 Salesforce에서 제공하는 디지털 마케팅 자동화 플랫폼입니다. 비즈니스에 여러 채널에서 다양한 마케팅 활동을 관리하고 자동화할 수 있는 포괄적인 도구 모음을 제공합니다. Cortex Framework는 데이터 분석 및 AI 엔진 역할을 하여 결과를 이해하고, 개선이 필요한 영역을 파악하고, 더 나은 결과를 얻기 위해 마케팅 전략을 최적화하는 데 도움이 됩니다.
다음 다이어그램은 Cortex Framework Data Foundation의 마케팅 워크로드를 통해 SFMC 데이터를 사용하는 방법을 설명합니다.
구성 파일
config.json
파일은 다양한 워크로드에서 데이터를 전송하기 위해 데이터 소스에 연결하는 데 필요한 설정을 구성합니다. 이 파일에는 SFMC의 다음 매개변수가 포함됩니다.
"marketing": {
"deploySFMC": true,
"SFMC": {
"deployCDC": true,
"fileTransferBucket": "",
"datasets": {
"cdc": "",
"raw": "",
"reporting": "REPORTING_SFMC"
}
}
}
다음 표에는 각 마케팅 매개변수의 값이 설명되어 있습니다.
매개변수 | 의미 | 기본값 | 설명 |
marketing.deploySFMC
|
SFMC 배포 | true
|
SFMC 데이터 소스의 배포를 실행합니다. |
marketing.SFMC.deployCDC
|
SFMC용 CDC 스크립트 배포 | true
|
Cloud Composer에서 DAG로 실행할 Salesforce Marketing Cloud (SFMC) CDC 처리 스크립트를 생성합니다. |
marketing.SFMC.fileTransferBucket
|
데이터 추출 파일이 포함된 버킷 | - | Salesforce Marketing Cloud (SFMC) 자동화 스튜디오 데이터 추출 파일이 저장되는 버킷입니다. |
marketing.SFMC.datasets.cdc
|
SFMC용 CDC 데이터 세트 | Salesforce Marketing Cloud (SFMC)용 CDC 데이터 세트입니다. | |
marketing.SFMC.datasets.raw
|
SFMC용 원시 데이터 세트 | Salesforce Marketing Cloud (SFMC)의 원시 데이터 세트입니다. | |
marketing.SFMC.datasets.reporting
|
SFMC용 보고 데이터 세트 | "REPORTING_SFMC"
|
Salesforce Marketing Cloud (SFMC)의 보고 데이터 세트입니다. |
데이터 모델
이 섹션에서는 항목 관계 다이어그램 (ERD)을 사용하여 Salesforce Marketing Cloud (SFMC) 데이터 모델을 설명합니다.
기본 조회수
ERD의 파란색 객체이며 일부 열 이름 별칭 외에 변환이 없는 CDC 테이블의 뷰입니다. src/marketing/src/SFMC/src/reporting/ddls
에서 스크립트를 확인하세요.
보고 보기
ERD의 녹색 객체이며 집계 측정항목이 포함된 보고 뷰입니다. src/marketing/src/SFMC/src/reporting/ddls
에서 스크립트를 확인하세요.
Automation Studio를 사용한 데이터 추출
SFMC Automation Studio를 사용하면 SFMC 소비자가 SFMC 데이터를 다양한 저장소 시스템으로 내보낼 수 있습니다. Cortex Framework Data Foundation은 Cloud Storage 버킷에서 Automation Studio로 만든 파일 모음을 찾습니다. 이 과정에서 SFMC 이메일 스튜디오도 사용해야 합니다.
데이터 추출 및 내보내기 프로세스를 설정하려면 다음 단계를 따르세요.
- Cloud Storage 버킷을 설정합니다. 이 버킷은 SFMC에서 내보낸 파일을 저장합니다. 버킷
marketing.SFMC.fileTransferBucket
구성 매개변수의 이름을 지정합니다. Salesforce 문서의 안내를 참고하세요. 데이터 확장 프로그램 만들기 데이터를 추출하려는 각 항목에 대해 Email Studio에서 데이터 확장을 만듭니다. 이는 SFMC 내부 데이터베이스에서 데이터 소스를 식별하는 데 필요합니다.
- 항목의
src/SFMC/config/table_schema
에 정의된 모든 필드를 나열합니다. 더 많거나 적은 필드를 추출하도록 이를 맞춤설정해야 하는 경우 이 단계와 테이블 스키마 파일에서 필드 목록이 정렬되어 있는지 확인하세요. 예를 들면 다음과 같습니다.
Entity: unsubscribe Fields: AccountID OYBAccountID JobID ListID BatchID SubscriberID SubscriberKey EventDate IsUnique Domain
- 항목의
SQL 쿼리 활동 만들기 각 항목에 대해 SQL 쿼리 활동을 만듭니다. 이 활동은 이전에 만든 해당 데이터 확장 프로그램에 연결됩니다. 이 단계에 관한 자세한 내용은 Salesforce 문서 를 참고하세요.
- 모든 관련 필드가 포함된 SQL 쿼리를 정의합니다. 쿼리는 이전 단계의 데이터 확장 프로그램에 정의된 항목과 관련된 모든 필드를 선택해야 합니다.
- 올바른 데이터 확장 프로그램을 타겟으로 선택합니다.
- 데이터 작업으로 덮어쓰기를 선택합니다.
- 다음 쿼리 예시를 참고하세요.
SELECT AccountID, OYBAccountID, JobID, ListID, BatchID, SubscriberID, SubscriberKey, EventDate, IsUnique, Domain FROM _Unsubscribe
데이터 추출 활동을 만듭니다. 각 항목에 대한 데이터 추출 활동 을 만드는 방법은 Salesforce 문서를 참고하세요. 이 활동은 Salesforce 데이터 확장 프로그램에서 데이터를 가져와 CSV 파일로 추출합니다. 이 단계에서는 다음을 실행합니다.
- 올바른 이름 지정 패턴을 사용합니다. 설정에 정의된 패턴과 일치해야 합니다.
예를 들어
Unsubscribe
항목의 경우 파일 이름은unsubscribe_%%Year%%_%%Month%%_%%Day%% %%Hour%%.csv
와 같을 수 있습니다. - Extract Type(추출 유형)을
Data Extension Extract
로 설정합니다. - 열 헤더 있음 및 텍스트 한정됨 옵션을 선택합니다.
- 올바른 이름 지정 패턴을 사용합니다. 설정에 정의된 패턴과 일치해야 합니다.
예를 들어
형식을 UTF-16에서 UTF-8로 변환하는 파일 변환 활동 만들기 기본적으로 Salesforce는 CSV 파일을 UTF-16으로 내보냅니다. 이 단계에서는 UTF-8 형식으로 변환합니다. 각 항목에 대해 파일 변환을 위한 또 다른 데이터 추출 활동을 만듭니다. 이 단계에서는 다음을 실행합니다.
- 데이터 추출 활동의 이전 단계에서 사용한 것과 동일한 파일 이름 패턴을 사용합니다.
- Extract Type을
File Convert
로 설정합니다. Convert To
의 드롭다운에서UTF8
를 선택합니다.
파일 전송 활동 만들기 각 항목에 대해 파일 전송 활동을 만듭니다. 이러한 활동은 추출된 CSV 파일을 Salesforce Safehouse에서 Cloud Storage 버킷으로 이동합니다. 이 단계에서는 다음을 수행합니다.
- 이전 단계에서 사용한 것과 동일한 파일 이름 패턴을 사용합니다.
- 이전에 프로세스에서 대상으로 설정된 Cloud Storage 버킷을 선택합니다.
실행을 예약합니다. 모든 활동이 완료되면 이를 실행할 자동 예약을 설정합니다.
데이터 최신 상태 및 지연
일반적으로 Cortex Framework 데이터 소스의 데이터 최신성은 업스트림 연결에서 허용하는 사항과 DAG 실행 빈도에 따라 제한됩니다. 업스트림 빈도, 리소스 제약조건, 비즈니스 요구사항에 맞게 DAG 실행 빈도를 조정합니다.
SFMC Automation Studio의 경우 데이터 업데이트 빈도 지연은 데이터 내보내기가 설정될 때의 예약 지연에 따라 달라집니다.
Cloud Composer 연결 권한
Cloud Composer에서 다음 연결을 만듭니다. 자세한 내용은 Airflow 연결 관리 문서를 참고하세요.
연결 이름 | 목적 |
sfmc_raw_dataflow
|
SFMC 추출된 파일 > BigQueryRaw 데이터 세트 |
sfmc_cdc_bq
|
원시 데이터 세트 > CDC 데이터 세트 전송 |
sfmc_reporting_bq
|
CDC 데이터 세트 > 보고 데이터 세트 전송 |
Cloud Composer 서비스 계정 권한
Cloud Composer에서 사용되는 서비스 계정 (sfmc_raw_dataflow
연결에 구성됨)에는 Dataflow 관련 권한이 필요합니다.
Dataflow 문서의 안내 참고
처리 설정
src/SFMC/config/ingestion_settings.yaml
파일의 설정을 통해 Source to Raw
및 Raw to CDC
데이터 파이프라인을 제어합니다.
이 섹션에서는 각 데이터 파이프라인의 매개변수를 설명합니다.
원시 테이블의 소스
이 섹션에는 Automation Studio에서 추출된 파일이 사용되는 방식을 제어하는 항목이 있습니다. 각 항목은 하나의 SFMC 항목에 해당합니다. 이 구성을 기반으로 Cortex Framework는 Dataflow 파이프라인을 실행하여 내보낸 파일의 데이터를 원시 데이터 세트의 BigQuery 테이블로 로드하는 Airflow DAG를 만듭니다.
디렉터리 src/SFMC/config/table_schema
에는 SFMC에서 추출된 각 항목의 스키마 파일이 포함되어 있습니다. 각 파일에서는 Automaton Studio에서 추출한 csv 파일을 읽어 BigQueryraw 데이터 세트에 성공적으로 로드하는 방법을 설명합니다.
각 스키마 파일에는 다음과 같은 세 열이 포함됩니다.
SourceField
: csv 파일의 필드 이름입니다.TargetField
: 이 항목의 원시 테이블에 있는 열 이름입니다.DataType
: 각 원시 테이블 필드의 데이터 유형입니다.
다음 매개변수는 각 항목의 Source to Raw
설정을 제어합니다.
매개변수 | 설명 |
base_table
|
SFMC 항목에서 추출한 데이터가 로드되는 원시 테이블 이름입니다. |
load_frequency
|
추출된 파일에서 데이터를 로드하기 위해 이 항목의 DAG가 실행되는 빈도입니다. 가능한 값에 관한 자세한 내용은 Airflow 문서를 참고하세요. |
file_pattern
|
Automation Studio에서 Cloud Storage 버킷으로 내보내는 이 테이블의 파일 패턴입니다. 추출된 파일에 제안된 이름과 다른 이름을 선택한 경우에만 변경하세요. |
partition_details
|
성능 고려사항을 위해 원시 테이블이 파티션된 방식 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능 고려사항으로 인해 원시 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
원시 테이블에서 CDC 테이블로
이 섹션에서는 데이터가 원시 테이블에서 CDC 테이블로 이동하는 방식을 제어하는 항목을 설명합니다. 각 항목은 원시 테이블에 해당합니다.
다음 매개변수는 각 항목의 Raw to CDC
설정을 제어합니다.
매개변수 | 설명 |
base_table
|
CDC 변환 후 원시 데이터가 저장되는 CDC 데이터 세트의 테이블입니다. |
load_frequency
|
이 항목의 DAG가 CDC 테이블을 채우기 위해 실행되는 빈도입니다. 가능한 값에 관한 자세한 내용은 Airflow 문서를 참고하세요. |
raw_table
|
원시 데이터 세트의 소스 테이블 |
row_identifiers
|
이 테이블의 고유한 레코드를 형성하는 열 (쉼표로 구분됨)입니다. |
partition_details
|
성능 고려사항을 위해 CDC 테이블이 파티션된 방식 자세한 내용은 테이블 파티션을 참고하세요. |
cluster_details
|
선택사항: 성능 고려사항으로 이 테이블을 클러스터링하려는 경우 자세한 내용은 클러스터 설정을 참고하세요. |
보고서 설정
보고 설정 파일(src/SFMC/config/reporting_settings.yaml
)을 사용하여 Cortex Framework가 SFMC 최종 보고 영역의 데이터를 생성하는 방식을 구성하고 제어할 수 있습니다. 이 파일은 보고 영역 BigQuery 객체(테이블, 뷰,함수 또는 저장 프로시저)가 생성되는 방식을 제어합니다.
자세한 내용은 보고서 설정 파일 맞춤설정을 참고하세요.
다음 단계
- 다른 데이터 소스 및 워크로드에 관한 자세한 내용은 데이터 소스 및 워크로드를 참고하세요.
- 프로덕션 환경에서 배포하는 단계에 관한 자세한 내용은 Cortex Framework Data Foundation 배포 기본 요건을 참고하세요.