收集 Cloud Composer 设置
本页介绍了如何收集 Cloud Composer 设置,以便在 Cortex Framework 中自动处理数据。
如果 Cloud Composer 可用,您需要在 Cloud Composer 中创建连接,将其指向存储数据的源项目,并根据要部署的工作负载使用以下名称。如需详细了解工作负载,请参阅数据源和工作负载。 如果您要在“报告”层中创建表,请务必为报告 DAG 创建单独的连接。
部署工作负载 | 为原始素材创建 | 为 CDC 创建 | 创建以供报告 |
SAP | 无 | sap_cdc_bq
|
sap_reporting_bq
|
SFDC | sfdc_cdc_bq
|
sfdc_cdc_bq
|
sfdc_reporting_bq
|
Google Ads | googleads_raw_dataflow
|
googleads_cdc_bq
|
googleads_reporting_bq
|
CM360 | cm360_raw_dataflow
|
cm360_cdc_bq
|
cm360_reporting_bq
|
Meta | meta_raw_dataflow
|
meta_cdc_bq
|
meta_reporting_bq
|
TikTok | tiktok_raw_dataflow
|
tiktok_cdc_bq
|
tiktok_reporting_bq
|
LiveRamp | 无 | liveramp_cdc_bq
|
无 |
SFMC | sfmc_raw_dataflow
|
sfmc_cdc_bq
|
sfmc_reporting_bq
|
DV360 | 无 | dv360_cdc_bq
|
dv360_reporting_bq
|
GA4 | 无 | 无 | ga4_reporting_bq
|
Oracle EBS | 无 | 无 | oracleebs_reporting_bq
|
可持续发展 | 无 | 无 | k9_reporting_bq
|
常见维度 | 无 | 无 | k9_reporting
|
连接命名惯例
请考虑以下连接命名惯例规范:
- 连接后缀:连接名称包含后缀,用于指明其预期用途:
_bq
:用于访问 BigQuery 数据。_dataflow
:用于运行 Dataflow 作业。
- 原始数据连接:如果您使用的是 Cortex 提供的数据提取模块,则只需为原始数据创建连接。
- 多个数据源:如果您要部署多个数据源(例如 SAP 和 Salesforce),建议为每个数据源创建单独的连接,前提是系统对各个服务账号应用了安全限制。或者,您也可以在部署前修改模板中的连接名称,以使用同一连接写入 BigQuery。
安全性最佳实践
- 避免使用默认连接:不建议使用 Airflow 提供的默认连接和服务账号,尤其是在生产环境中。这与最小权限原则相符,该原则强调仅授予必要的最小访问权限。
- Secret Manager 集成:如果您为 Airflow 启用了 Secret Manager,则可以在 Secret Manager 中使用相同的名称创建这些连接。存储在 Secret Manager 中的连接优先于直接在 Airflow 中定义的连接。