Cloud Composer の設定の収集
このページでは、Cloud Composer の設定を収集して Cortex Framework 内でデータを自動化する方法について説明します。
Cloud Composer を使用できる場合は、データが存在するソース プロジェクトを指す Cloud Composer 内で接続を作成し、デプロイメントへのワークロードに基づいて次の名前を付ける必要があります。ワークロードの詳細については、データソースとワークロードをご覧ください。レポートレイヤにテーブルを作成する場合は、レポート DAG 用に個別の接続を作成してください。
ワークロードのデプロイ | Create for Raw | CDC 用に作成する | レポート用に作成 |
SAP | なし | sap_cdc_bq
|
sap_reporting_bq
|
SFDC | sfdc_cdc_bq
|
sfdc_cdc_bq
|
sfdc_reporting_bq
|
Google 広告 | googleads_raw_dataflow
|
googleads_cdc_bq
|
googleads_reporting_bq
|
CM360 | cm360_raw_dataflow
|
cm360_cdc_bq
|
cm360_reporting_bq
|
Meta | meta_raw_dataflow
|
meta_cdc_bq
|
meta_reporting_bq
|
TikTok | tiktok_raw_dataflow
|
tiktok_cdc_bq
|
tiktok_reporting_bq
|
LiveRamp | なし | liveramp_cdc_bq
|
なし |
SFMC | sfmc_raw_dataflow
|
sfmc_cdc_bq
|
sfmc_reporting_bq
|
ディスプレイ&ビデオ 360 | なし | dv360_cdc_bq
|
dv360_reporting_bq
|
GA4 | なし | なし | ga4_reporting_bq
|
Oracle EBS | なし | なし | oracleebs_reporting_bq
|
サステナビリティ | なし | なし | k9_reporting_bq
|
一般的なディメンション | なし | なし | k9_reporting
|
接続の命名規則
接続の命名規則には、次の仕様を考慮してください。
- 接続接尾辞: 接続名には、目的を示す接尾辞が含まれています。
_bq
: BigQuery データへのアクセスに使用されます。_dataflow
: Dataflow ジョブの実行に使用されます。
- 元データ接続: Cortex から提供されるデータ取り込みモジュールを使用している場合にのみ、元データの接続を作成する必要があります。
- 複数のデータソース: 複数のデータソース(SAP と Salesforce の両方など)をデプロイする場合は、個々のサービス アカウントにセキュリティ制限が適用されることを前提として、それぞれに個別の接続を作成することをおすすめします。または、デプロイ前にテンプレートの接続名を変更して、BigQuery への書き込みに同じ接続を使用するようにすることもできます。
おすすめのセキュリティ対策
- デフォルトの接続を使用しないでください。特に本番環境では、Airflow が提供するデフォルトの接続とサービス アカウントを使用しないでください。これは、必要な最小限のアクセス権のみを付与することを重視する最小権限の原則に沿っています。
- Secret Manager との統合: Airflow で Secret Manager が有効になっている場合は、同じ名前を使用して Secret Manager 内にこれらの接続を作成できます。Secret Manager に保存されている接続は、Airflow で直接定義された接続よりも優先されます。