Google アナリティクス 4 との統合
このページでは、Cortex Framework Data Foundation のマーケティング ワークロードのデータソースとして Google アナリティクス 4(GA4)からデータを取得するために必要な構成について説明します。
GA4 は Google アナリティクスの最新バージョンです。イベントベースのトラッキングと機械学習に重点を置いて、ユーザー行動の全体像を把握し、より深い分析情報を提供します。Cortex Framework を使用すると、GA4 からデータを抽出して BigQuery に統合し、さらに分析やレポート作成を行うことができます。有益な分析情報を得て、ビジネスの成果を高めることができます。
次の図は、Cortex Framework Data Foundation のマーケティング ワークロードで GA4 データを利用できるようにする方法を示しています。
構成ファイル
config.json
ファイルでは、さまざまなワークロードからデータを転送するためにデータソースに接続するために必要な設定を構成します。このファイルには、GA4 の次のパラメータが含まれています。
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
次の表に、各マーケティング パラメータの値を示します。
パラメータ | 意味 | デフォルト値 | 説明 |
marketing.deployGA4
|
GA4 をデプロイする | true
|
GA4 データソースのデプロイを実行します。 |
marketing.GA4.datasets.cdc
|
GA4 の BigQuery Export データセット | [{"property_id": 0, "name": ""}]
|
Google アナリティクス 4 BigQuery Export データセットの配列。各要素で、Property ID を INT として指定し、対応する BigQuery Export データセット名も指定します。 |
marketing.GA4.datasets.reporting
|
GA4 のレポート データセット | REPORTING_GA4
|
GA4 のレポート データセット。 |
データモデル
このセクションでは、エンティティ関係図(ERD)を使用して GA4 データモデルについて説明します。
ベースビュー
これらは ERD の青色のオブジェクトであり、複雑なデータ構造を展開するために最小限の変換を加えた CDC テーブルのビューです。スクリプトは src/marketing/src/GA4/src/reporting/ddls
にあります。
レポートビュー
これらは ERD の緑色のオブジェクトであり、集計指標を含むレポートビューです。スクリプトは src/marketing/src/GA4/src/reporting/ddls
にあります。
GA4 との連携を設定する
Cortex Framework Data Foundation は、GA4 の BigQuery Export データセット(Cortex Framework アーキテクチャでは CDC データセットとして扱われます)の上にレポートレイヤを作成することで、GA4 と統合されます。これは、レポート設定の構成に応じて、CDC テーブルの上にランタイム ビューを作成するか、BigQuery テーブルのマテリアライズド データに対して Cloud Composer DAG を実行することで実現されます。
GA4 BigQuery Export を設定する
Cortex Framework は、GA4 の BigQuery Export 機能を使用して、ソースシステムから BigQuery にデータを読み込みます。BigQuery Export または各 GA4 プロパティの設定手順については、GA4 ヘルプ記事の GA4 - BigQuery Export を設定するをご覧ください。
既知の問題、制限事項、その他の考慮事項
GA4 BigQuery Export を設定する際は、次の点を考慮してください。
- バックフィル: GA4 BigQuery Export は、設定した日から開始され、バックフィルは行われません。
- GA4 の UI と Cortex Framework で報告される数値の違い: サンプリング、データ収集の遅延、高基数レポートなど、複数の要因により、Google アナリティクスの UI と Cortex Framework で多少の差異が生じることがあります。これは Google アナリティクスの既知の制限事項です。詳細については、Google アナリティクスの UI と BigQuery Export のギャップを埋める をご覧ください。
- イベント エクスポートの量に関する制限: Google アナリティクスのエディションによっては、1 日あたりの BigQuery エクスポートの量に制限が設けられています。詳細については、GA4 - BigQuery Export を設定するをご覧ください。
- タイムゾーン: BigQuery Export では、
event_date
はプロパティのレポート タイムゾーンで設定されますが、event_timestamp
はUTC のタイムスタンプ(マイクロ秒単位)です。そのため、event_timestamp
を使用する場合は、UI の数値と比較する際に、レポートのタイムゾーンに合わせて調整してください。 - 日次イベント エクスポートとストリーミング(リアルタイム)イベント エクスポート: イベント エクスポートの場合、Cortex Framework は、完全な日次エクスポートによって作成された
events_YYYYMMDD
テーブルのみをサポートします。詳細については、GA4 - BigQuery Export をご覧ください。 - BigQuery Export の GA4 360 サービスレベル契約(SLA): Cortex Framework では、毎日(高頻度)エクスポートによって作成された
events_fresh_
テーブルを個別のソーステーブルとしてサポートしていませんが、Events
レポートビューの##CORTEX-CUSTOMER
カスタマイズ コメントに沿ってソーステーブルをこれらのテーブルに置き換えることで、この機能で提供される SLA を利用できます。すべてのレポートビューは、この置換後も引き続き機能します。
データの更新頻度と遅延
一般に、Cortex Framework データソースのデータの更新頻度は、アップストリーム接続で許可される頻度と DAG 実行の頻度によって制限されます。アップストリームの頻度、リソースの制約、ビジネスニーズに合わせて DAG の実行頻度を調整します。
Google アナリティクス 4 では、毎日(高頻度)エクスポートを使用している場合を除き、タイムゾーンによっては BigQuery エクスポート データが最大で 1 日遅れることがあります。
構成
このセクションでは、データ処理の構成について説明します。
Cloud Composer 接続
Cloud Composer で次の接続を作成します。詳細については、Airflow 接続を管理するドキュメントをご覧ください。
接続名 | 目的 |
dv360_cdc_bq
|
元データセット > CDC データセットの転送の場合。 |
dv360_reporting_bq
|
CDC データセットの場合は、[レポート データセットの転送] に移動します。 |
レポート設定
Cortex Framework が GA4 最終レポートレイヤ用にデータを生成する方法は、レポート設定ファイル src/GA4/config/reporting_settings.yaml
を使用して構成、制御できます。このファイルは、レポートレイヤの BigQuery オブジェクト(テーブル、ビュー、関数、ストアド プロシージャ)の生成方法を制御します。
詳細については、レポート設定ファイルのカスタマイズをご覧ください。
次のステップ
- その他のデータソースとワークロードの詳細については、データソースとワークロードをご覧ください。
- 本番環境にデプロイする手順の詳細については、Cortex Framework Data Foundation のデプロイの前提条件をご覧ください。