与 LiveRamp 集成
本页介绍了将 LiveRamp 中的数据作为 Cortex Framework Data Foundation 营销工作负载的数据源所需的配置。
LiveRamp 是一个数据协作平台,可帮助企业关联、控制和激活其数据,从而改善客户体验并提升业务成效。Cortex Framework 提供了分析这些数据、将其与其他数据源相结合,以及使用 AI 技术获得更深入的数据洞见和优化营销策略的工具和平台。
下图描述了如何通过 Cortex Framework Data Foundation 的营销工作负载使用 LiveRamp 数据源:
配置文件
config.json
文件用于配置连接到数据源以从各种工作负载传输数据所需的设置。此文件包含 LiveRamp 的以下参数:
"marketing": {
"deployLiveRamp": true,
"LiveRamp": {
"datasets": {
"cdc": ""
}
}
}
下表介绍了每个 LiveRamp 参数的值:
参数 | 含义 | 默认值 | 说明 |
marketing.LiveRamp
|
部署 LiveRamp | true
|
为 LiveRamp 数据源执行部署。 |
marketing.LiveRamp.datasets.cdc
|
适用于 LiveRamp 的 CDC 数据集 | 适用于 LiveRamp 的 CDC 数据集。 |
API 连接
Cortex Framework Data Foundation 通过与 LiveRamp 集成来实现身份解析。Cortex Framework 可以执行 RampID 查找,让企业能够从其 CRM 系统中识别已知受众群体或客户细分受众群。
RampID 是 LiveRamp API 使用电子邮件地址、电话号码和姓名等个人身份信息 (PII) 生成的标识符。借助此 RampID,企业可以识别和整合多个系统(例如不同广告系列的受众群体)中的记录。通过与 LiveRamp 集成,企业可以更好地识别和定位受众群体,从而投放更具成效且个性化的营销广告系列。
借助 LiveRamp Identity Resolution Retrieval API,企业可以以编程方式将个人身份信息数据解析为个人。Cortex Framework 通过通过 API 调用发送经过哈希处理的个人身份信息 (PII) 数据来使用 LiveRamp 的查询端点。
输入表和输出表
部署 Cortex Framework 后,系统会在 config.json
中提供的相关数据集中创建以下两个 BigQuery 表。
rampid_lookup_input
个表
rampid_lookup_input
表是 RampID 查询过程的输入。
列 | 数据类型 | 说明 | 示例 | 主键 |
id | STRING | 此记录的唯一 ID。 | “123” | 是 |
segment_name | STRING | 受众群体/客户关系管理 (CRM)/客户细分受众群的名称。 | “高价值” | 否 |
source_system_name | STRING | 记录的来源系统。 | “Salesforce” | 否 |
名称 | STRING | 客户名称 | “John Doe” | 否 |
电子邮件 | STRING | 客户电子邮件地址 | “example@example.com” | 否 |
phone_number | STRING | 客户电话 | "1234567890" | 否 |
postal_code | STRING | 客户邮政编码 | “12345” | 否 |
is_processed | 布尔值 |
指示记录是否已处理。
对于新记录,请将此字段填充为 FALSE。 系统会在处理完毕后将此值更新为 TRUE。 |
FALSE | 否 |
load_timestamp | 时间戳 | 记录在系统中插入的时间戳。这纯粹是为了审核目的。 | “2020-01-01 00:00:00 UTC” | 否 |
processed_timestamp | 时间戳 | 系统为此记录执行 API 查询时的时间戳。此字段始终由系统填充。 | “2020-01-01 00:00:00 UTC” | 否 |
您需要定期(根据您的业务需求)在 rampid_lookup_input
表中填充客户的个人身份信息 (PII) 详细信息,例如:Cortex Framework 不提供自动执行此操作的方法,但提供了示例脚本 ddls/samples/populate_rampid_lookup_input.sql
,该脚本展示了如何使用已部署 Cortex Framework 的 Salesforce 系统中的数据填充此表。如果您的数据来自其他系统,您可以将此文件用作指南。
确保 rampid_lookup_input
表中没有重复条目(例如,同一个人多次出现,且具有相同的个人身份信息,即使其 ID
可能不同)。如果某个片段包含许多重复条目,Cortex Framework 查找 DAG 将会失败。这由 LiveRamp API 强制执行。
rampid_lookup
表
rampid_lookup
表是一个输出表,其中包含输入记录中每个细分段的 RampID。LiveRamp 的设计不允许将 RampID 映射到单个记录。
列 | 数据类型 | 说明 |
segment_name | STRING | 输入表中的细分名称。 |
ramp_id | STRING | LiveRamp RampID |
记录戳记 | 时间戳 | 执行此 RampID 查询时的时间戳。 |
对于同一用户,LiveRamp RampID 可能会在一段时间内发生变化。这意味着,您需要不时对已处理的数据执行新的查找。Cortex Framework 提供了示例脚本 ddls/samples/clean_up_segment_matching.sql
,展示了如何在细分级别执行此操作。这样,您就可以重置整个细分,系统会对该细分进行查找,并为您提供最新的 RampID。
与输入表相比,rampid_lookup
(输出表)可能包含的记录数量略少。这是有意为之,因为 Cortex Framework 会尝试使用个人身份信息详细信息调试输入记录,以确保 LiveRamp API 查找不会失败。
账号身份验证
- 与 LiveRamp 联系以获取身份验证凭据。其中应包含客户端 ID 和客户端密钥。
使用 Secret Manager 创建一个名为
cortex-framework-liveramp
的 Secret,并使用以下内容作为值。请参阅 Secret-Manager 文档中的说明。{ 'client_id':'CLIENT_ID', 'client_secret':'CLIENT_SECRET', 'grant_type':'client_credentials' }
替换以下内容:
- 将“CLIENT_ID”替换为您在第 1 步中获取的客户端 ID。
- 将“CLIENT_SECRET”替换为从第 1 步中获取的客户端密钥。
Cloud Composer 连接
在 Cloud Composer 中创建以下连接。如需了解详情,请参阅“管理 Airflow 连接”文档。
连接名称 | 目的 |
liveramp_cdc_bq
|
对于 LiveRamp API > CDC 数据集传输 |
配置
config.ini
文件用于控制 Cloud Composer DAG 的某些行为,以及 LiveRamp API 的使用方式。根据您的需求配置 LiveRamp/src/pipelines/config.ini
文件。虽然文件中已介绍了这些参数,但请注意 liveramp_api_base_url
。此参数默认指向 LiveRamp 的生产 API 网址,出于测试目的,您可能需要将其指向预演版(具体取决于您的设置)。
后续步骤
- 如需详细了解其他数据源和工作负载,请参阅数据源和工作负载。
- 如需详细了解在生产环境中部署的步骤,请参阅 Cortex Framework Data Foundation 部署前提条件。