アーキテクチャ: マーケティングデータウェアハウス

Last reviewed 2022-03-23 UTC

このドキュメントでは、スケーラブルなマーケティングデータウェアハウスの構リファレンスアーキテクチャを記載し、その構築方法について説明します。マーケティングデータウェアハウスソリューションを使用すると、ユーザーのプライバシーを尊重しながら、ターゲットを絞ってカスタマイズした広告をタイミングよくユーザーに配信できます。このドキュメントは、マーケティング分析のサポートを担当する、マーケティング関連のデータエンジニア、データサイエンティスト、IT メンバーを対象としています。

マーケティングデータウェアハウスを実装すると、次のビジネスニーズに対応できます。

包括的な分析情報: 複数の Software as a Service（SaaS）プラットフォームを使用している場合は、このアーキテクチャを使用してマーケティングデータと広告データを BigQuery に統合できます。ビジネス関係者は、マーケティングと業績に関するリアルタイムの分析情報を取得できます。
マーケティングイノベーション: データサイエンティストまたはデータエンジニアは、顧客セグメンテーション、顧客のライフタイムバリュー、商品の最適化案、購入予測などのビジネスニーズに合わせて ML モデルを構築できます。構築した ML モデルは、メールマーケティングや広告ターゲティングなどの複数のプラットフォームで有効にできます。
カスタマーエクスペリエンス: マーケティングデータウェアハウスでは、お客様の好みをより高度に把握できるため、正確なパーソナライズでカスタマーエクスペリエンスを向上させることができます。この分析情報を得ることで、ファーストパーティのアプリケーション、ウェブサイト、オンライン広告、メールマーケティングなどの顧客とのインタラクションポイントをカスタマイズできます。

アーキテクチャ

次の図は、複数のデータ分析と ML プロダクトを使用する Google Cloud での一般的なマーケティング分析のリファレンスアーキテクチャを示しています。

Google Cloud 上のマーケティング分析リファレンスアーキテクチャ。

この図には、マーケティングデータウェアハウスのワークフローで構成できる、次のステージが示されています。

データの取り込み
データ処理
ML
分析情報と有効化

アーキテクチャコンポーネント

このセクションでは、必要となるテクノロジーコンポーネントを含め、マーケティングデータウェアハウスソリューションのステージについて説明します。

データの取り込み

マーケティングデータウェアハウスを構築する際の第一歩は、データを 1 か所に集約することです。データは次のデータソースから取り込むことができます。

Google および SaaS プラットフォーム: Google アナリティクス、Google 広告、Google マーケティングプラットフォームなどのデータソースを、BigQuery 内の Google Cloud マーケティングデータウェアハウスに取り込むことができます。Salesforce のようなソースからデータをインポートするには、Google Cloud で、またはパートナーを通じて、SaaS コネクタを利用できます。
パブリッククラウド: BigQuery Data Transfer Service を利用すると、他のパブリッククラウドからデータをインポートできます。たとえば、Amazon S3 から BigQuery にデータを移動するには、繰り返し実行される読み込みジョブを自動的にスケジュール設定し、管理します。また、Google Cloud とアマゾンウェブサービス（AWS）にまたがってデータを分析できる柔軟なマルチクラウド分析ソリューションである BigQuery Omni を使用することもできます。
API、フラットファイル、オンプレミスの自社データ: 顧客管理（CRM）システムや PoS（Point of Sale）システムなどのソースからデータを取り込むことができます。通常、このデータの取り込みは、bq コマンドラインツール、BigQuery API、Google Cloud コンソールを使用してオフラインで行います。データはローカルで、または Cloud Storage から読み込めます。大規模なデータセットの場合は、帯域幅の使用を抑え、ネットワークの速度とプロダクトインテグレーションを最適化するために、Cloud Storage を使用することをおすすめします。イベントドリブンで BigQuery にデータを読み込むには、Cloud Functions のトリガーを設定します。たとえば、新しいデータの可用性に基づいてトリガーを設定します。

上記の取り込み方法のほとんどでは、バッチ読み込みを使用します。ストリーミングデータセットを BigQuery に取り込む必要がある場合は、BigQuery のストリーミング機能を使用できます。ストリーミング分析のユースケースについては、ストリーミング分析ソリューションをご覧ください。

データ処理

取り込んだデータは、必要に応じて処理できます。このステージは、データに対してクエリを実行する前にデータを処理する必要がある場合にのみ必要です。データ処理には、大規模なデータセットに一貫性を持たせるためのクリーニングや再フォーマットが含まれます。Google Cloud 内で利用可能なデータ処理プロダクトを使用できます。

対象とするユーザーに基づいて、適切な Google Cloud プロダクトを選択してください。たとえば、次のユーザータイプにおすすめのプロダクトについて考えてみましょう。

抽出、変換、読み込み（ETL）データパイプラインを構築するデベロッパーは、Cloud Data Fusion データインテグレーションプロダクトを使用できます。Cloud Data Fusion に備わっている UI を使用して、コードを記述せずに ELT（抽出、読み込み、変換）と ETL データパイプラインをデプロイできます。
マーケティング分析をサポートするデータエンジニアリングチームは、Dataflow を使用できます。Dataflow を使用すると、バッチとストリーミング両方のデータソースを大規模に取り込んで分析できます。
データアナリストは Dataprep by Trifacta を使用して、BigQuery で分析を行うデータを視覚的に探索、クリーニング、準備できます。

ML

システムでのデータの取り込みと処理が完了したら、次のユースケースで Google AI Platform のプロダクトオプションを使用できます。

頻度がキャンペーンあたり、ユーザーあたりのコンバージョンに与える影響についての記述的分析: この情報により、特定のユーザーのリストに基づいて、リマーケティングキャンペーンのターゲティング頻度を調整できます。BigQuery はキャンペーンマネージャー 360 の元データにアクセスできるため、この情報を利用できます。
特定のユーザーのライフタイムバリューの予測分析: 特定のユーザーグループの価値を予測して、売上向上を目的にマーケティングキャンペーンを実施できます。たとえば、ユーザーグループのブランドエンゲージメントが限られていることがわかったら、ユーザーのエンゲージメントを高めることで、購入の可能性が高くなります。この分析情報は、データを結合して ML で顧客セグメントを構築し、ライフタイムバリューを予測することで得られます。
商品に対する感情についての処方的分析: 不正確なターゲティングを防ぐために、テキストのコメントや評価の推移を分析します。この分析により、特定の特徴を備えた商品を、ユーザーグループがどのように見て取るかを予測できます。たとえば、感情を予測するには、感情分析と顧客セグメンテーションを利用できます。

BigQuery でマーケティングデータが統合されていれば、ニーズに合った任意の AI Platform プロダクトを選択できます。組織の ML に関する習熟度とスキルセットに基づいて、次のいずれかのプロダクトを選択します。

組織が ML に精通していない場合は、AutoML を使用して顧客関連の ML モデルを構築し、デプロイできます。たとえば、AutoML Tables を使用して、顧客が離脱する可能性やライフタイムバリューなどを予測する回帰モデルと分類モデルを構築できます。
組織に SQL のスキルがある場合は、BigQuery ML で SQL 構文を使用して、オーディエンスセグメンテーションモデルなどのモデルを作成、評価、予測できます。BigQuery からデータを移動せずに、サポートされている多くのモデルをトレーニングしてデプロイし、ML ワークフローを実行できます。
組織にデータサイエンティストのチームが存在する場合は、Vertex AI を使用して最適化されたモデルを大規模に構築し、デプロイできます。Vertex AI を使用して顧客のライフタイムバリューを解決する方法の例については、AI Platform を使用したお客様のライフタイムバリューの予測をご覧ください。

分析情報と有効化

Google Cloud のオプションを使用して、統合された広告およびマーケティングデータから分析情報を取得できます。このデータ（差別化されたセグメントなど）を、Google アナリティクスやメールマーケティングなどのプラットフォームに反映できます。Google Cloud には、ニーズに基づいてデータを活用するさまざまな方法が用意されています。たとえば、差別化されたセグメントをお好みのチャネル（Google アナリティクスや Salesforce など）に反映できます。

Google マーケティングプラットフォーム向けの Looker

エンタープライズビジネスインテリジェンス（BI）プラットフォームである Looker を使用して、分析情報を確認し、共有することもできます。Looker を使用すれば、複数のデータセットを結合して、クロスチャネルでの顧客行動を追跡し、顧客を属性別にセグメント化できます。

Looker を使用して次の分析情報を生成できます。

投資収益率（ROI）分析: キャンペーンによって生み出された支出と収益を把握できます。
アラート: 戦術または広告が失敗した場合にメール通知アラートを受け取るためのカスタムルールを設定できます。
クロスチャネルアトリビューションの分析:: マーケティングチャネル間での顧客の行動の傾向を特定できます。
A/B テスト: 統計的に有意な結果に基づいて、バリエーションがユーザーの主な行動にどのように影響するかを分析できます。
ユーザー獲得チャネル: 新しい見込み顧客やユーザーの流入元をトラッキングできます。
コホート分析: データをセグメント化して、さまざまなセグメントの経時的な行動を分析できます。

Looker 内のブロックとアクションは、Google マーケティングプラットフォームの広告データとウェブデータに対する堅牢で共有可能な分析の基盤を提供します。こうしたカスタマイズ可能なブロックとアクションを利用して、インタラクティブなデータ探索、軽量の ML 予測を組み込んだ新しいデータスライス、Google マーケティングプラットフォームへのアクティベーションパスを実現できます。アクティベーションパスを使用すると、自社データを使用して対象グループを効果的に設定できます。

次の図は、Google プロダクトと Looker が連携する仕組みを示しています。

プロダクトと Looker の連携の仕組み。

この図に、Looker で Google アナリティクス 4、Google アナリティクス 360、キャンペーンマネージャー 360 からの分析情報、および BigQuery 内のデータを使用して、リアルタイムレポートを作成する方法が示されています。Actions for Ads（カスタマーマッチを使用）とアナリティクス（データインポートを使用）により、Looker からのデータを Google マーケティングプラットフォームで活用できます。IAM などの業種共通サービスは、マーケティングデータパイプラインを継続的にモニタリングします。

カスタムインテグレーション

Google Cloud を使用してカスタムインテグレーションを構成し、任意のプラットフォームにデータを push することもできます。たとえば、スケジュールされたクエリを Google アナリティクスのデータに対して実行してオーディエンスリストを生成し、API 呼び出しでそのデータをアナリティクスに push できます。新しいデータが Cloud Storage 内で利用可能な状態になったら、たとえば Cloud Functions を使用してデータの push をトリガーします。

次のステップ

マーケティング分析ソリューションで詳細を確認する。
BigQuery Data Transfer Service と、さまざまな Google プロダクトに関する標準クエリについて学習する。
リファレンスアーキテクチャ、図、ベストプラクティスについて、Cloud アーキテクチャセンターで詳細を確認する。

アーキテクチャ: マーケティング データ ウェアハウス