Google アナリティクス 4 との統合

このページでは、Cortex Framework Data Foundation のマーケティング ワークロードのデータソースとして Google アナリティクス 4(GA4)からデータを取得するために必要な構成について説明します。

GA4 は Google アナリティクスの最新バージョンです。イベントベースのトラッキングと機械学習に重点を置いて、ユーザー行動の全体像を把握し、より深い分析情報を提供します。Cortex Framework を使用すると、GA4 からデータを抽出して BigQuery に統合し、さらに分析やレポート作成を行うことができます。有益な分析情報を得て、ビジネスの成果を高めることができます。

次の図は、Cortex Framework Data Foundation のマーケティング ワークロードで GA4 データを利用できるようにする方法を示しています。

GA4 データソース

図 1GA4 データソース。

構成ファイル

config.json ファイルでは、さまざまなワークロードからデータを転送するためにデータソースに接続するために必要な設定を構成します。このファイルには、GA4 の次のパラメータが含まれています。

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

次の表に、各マーケティング パラメータの値を示します。

パラメータ 意味 デフォルト値 説明
marketing.deployGA4 GA4 をデプロイする true GA4 データソースのデプロイを実行します。
marketing.GA4.datasets.cdc GA4 の BigQuery Export データセット [{"property_id": 0, "name": ""}] Google アナリティクス 4 BigQuery Export データセットの配列。各要素で、Property IDINT として指定し、対応する BigQuery Export データセット名も指定します。
marketing.GA4.datasets.reporting GA4 のレポート データセット REPORTING_GA4 GA4 のレポート データセット。

データモデル

このセクションでは、エンティティ関係図(ERD)を使用して GA4 データモデルについて説明します。

GA4 のエンティティ関係図

図 2GA4: エンティティ関係図

ベースビュー

これらは ERD の青色のオブジェクトであり、複雑なデータ構造を展開するために最小限の変換を加えた CDC テーブルのビューです。スクリプトは src/marketing/src/GA4/src/reporting/ddls にあります。

レポートビュー

これらは ERD の緑色のオブジェクトであり、集計指標を含むレポートビューです。スクリプトは src/marketing/src/GA4/src/reporting/ddls にあります。

GA4 との連携を設定する

Cortex Framework Data Foundation は、GA4 の BigQuery Export データセット(Cortex Framework アーキテクチャでは CDC データセットとして扱われます)の上にレポートレイヤを作成することで、GA4 と統合されます。これは、レポート設定の構成に応じて、CDC テーブルの上にランタイム ビューを作成するか、BigQuery テーブルのマテリアライズド データに対して Cloud Composer DAG を実行することで実現されます。

GA4 BigQuery Export を設定する

Cortex Framework は、GA4 の BigQuery Export 機能を使用して、ソースシステムから BigQuery にデータを読み込みます。BigQuery Export または各 GA4 プロパティの設定手順については、GA4 ヘルプ記事の GA4 - BigQuery Export を設定するをご覧ください。

既知の問題、制限事項、その他の考慮事項

GA4 BigQuery Export を設定する際は、次の点を考慮してください。

  • バックフィル: GA4 BigQuery Export は、設定した日から開始され、バックフィルは行われません。
  • GA4 の UI と Cortex Framework で報告される数値の違い: サンプリング、データ収集の遅延、高基数レポートなど、複数の要因により、Google アナリティクスの UI と Cortex Framework で多少の差異が生じることがあります。これは Google アナリティクスの既知の制限事項です。詳細については、Google アナリティクスの UI と BigQuery Export のギャップを埋める をご覧ください。
  • イベント エクスポートの量に関する制限: Google アナリティクスのエディションによっては、1 日あたりの BigQuery エクスポートの量に制限が設けられています。詳細については、GA4 - BigQuery Export を設定するをご覧ください。
  • タイムゾーン: BigQuery Export では、event_dateプロパティのレポート タイムゾーンで設定されますが、event_timestampUTC のタイムスタンプ(マイクロ秒単位)です。そのため、event_timestamp を使用する場合は、UI の数値と比較する際に、レポートのタイムゾーンに合わせて調整してください。
  • 日次イベント エクスポートとストリーミング(リアルタイム)イベント エクスポート: イベント エクスポートの場合、Cortex Framework は、完全な日次エクスポートによって作成された events_YYYYMMDD テーブルのみをサポートします。詳細については、GA4 - BigQuery Export をご覧ください。
  • BigQuery Export の GA4 360 サービスレベル契約(SLA): Cortex Framework では、毎日(高頻度)エクスポートによって作成された events_fresh_ テーブルを個別のソーステーブルとしてサポートしていませんが、Events レポートビューの ##CORTEX-CUSTOMER カスタマイズ コメントに沿ってソーステーブルをこれらのテーブルに置き換えることで、この機能で提供される SLA を利用できます。すべてのレポートビューは、この置換後も引き続き機能します。

データの更新頻度と遅延

一般に、Cortex Framework データソースのデータの更新頻度は、アップストリーム接続で許可される頻度と DAG 実行の頻度によって制限されます。アップストリームの頻度、リソースの制約、ビジネスニーズに合わせて DAG の実行頻度を調整します。

Google アナリティクス 4 では、毎日(高頻度)エクスポートを使用している場合を除き、タイムゾーンによっては BigQuery エクスポート データが最大で 1 日遅れることがあります。

構成

このセクションでは、データ処理の構成について説明します。

Cloud Composer 接続

Cloud Composer で次の接続を作成します。詳細については、Airflow 接続を管理するドキュメントをご覧ください。

接続名 目的
dv360_cdc_bq 元データセット > CDC データセットの転送の場合。
dv360_reporting_bq CDC データセットの場合は、[レポート データセットの転送] に移動します。

レポート設定

Cortex Framework が GA4 最終レポートレイヤ用にデータを生成する方法は、レポート設定ファイル src/GA4/config/reporting_settings.yaml を使用して構成、制御できます。このファイルは、レポートレイヤの BigQuery オブジェクト(テーブル、ビュー、関数、ストアド プロシージャ)の生成方法を制御します。

詳細については、レポート設定ファイルのカスタマイズをご覧ください。

次のステップ