アーキテクチャ: マーケティング データ ウェアハウス

このドキュメントでは、スケーラブルなマーケティング データ ウェアハウスの構築方法を説明するリファレンス アーキテクチャについて説明します。マーケティング データ ウェアハウス ソリューションは、ユーザーのプライバシーに配慮しながら、タイムリーでターゲットを絞った、カスタマイズされた広告エクスペリエンスをユーザーに提供します。このドキュメントは、マーケティング分析をサポートするマーケティング担当データ エンジニア、データ サイエンティスト、または IT メンバーを対象としています。

マーケティング データ ウェアハウスを実装すると、次のビジネスニーズに対処できます。

  • 包括的な分析情報: 複数の Software as a Service(SaaS)プラットフォームを使用している場合は、このアーキテクチャを使用して BigQuery でマーケティング データと広告データを統合できます。ビジネスの関係者であれば、マーケティングとビジネス パフォーマンスの分析情報をリアルタイムで取得できます。

  • マーケティング イノベーション: データ サイエンティストまたはデータ エンジニアは、顧客セグメンテーション、顧客のライフタイム バリュー、製品のレコメンデーション、購入予測などビジネスニーズに合わせて機械学習(ML)モデルを構築することができます。これらのモデルは、メール マーケティングや広告ターゲティングなど、複数のプラットフォームで有効にできます。

  • カスタマー エクスペリエンス: マーケティング データ ウェアハウスでは、お客様の好みをより高度に把握できるため、正確なパーソナライズでカスタマー エクスペリエンスを向上させることができます。この分析情報を得ることで、ファースト パーティのアプリケーション、ウェブサイト、オンライン広告、メール マーケティングなどの顧客とのインタラクション ポイントをカスタマイズできます。

アーキテクチャ

次の図は、複数のデータ分析プロダクトと ML プロダクトを使用する、Google Cloud 上の一般的なマーケティング分析リファレンス アーキテクチャを示しています。

Google Cloud 上のマーケティング分析リファレンス アーキテクチャ。

この図は、構成可能なマーケティング データ ウェアハウス ワークフローの次のステージを示しています。

  1. データの取り込み
  2. データ処理
  3. 機械学習
  4. 分析情報と有効化

アーキテクチャ コンポーネント

このセクションでは、マーケティング データ ウェアハウス ソリューションのステージを、必要なテクノロジー コンポーネントを含めて説明します。

データの取り込み

マーケティング データ ウェアハウスを構築する最初の手順は、データを 1 か所に統合することです。データを取り込むには、次のデータソースを使用します。

  • Google および SaaS プラットフォーム: Google アナリティクス、Google 広告、Google マーケティング プラットフォームなどのデータソースを、BigQuery の Google Cloud マーケティング データ ウェアハウスに取り込むことができます。Salesforce などのソースからデータを取り込むには、Google Cloud や Google のパートナーから SaaS コネクタを使用できます。
  • パブリック クラウド:BigQuery Data Transfer Service を使用して、他のパブリック クラウドからデータを取り込むことができます。たとえば、Amazon S3 から BigQuery にデータを移動するには、繰り返し実行する読み込みジョブを自動的にスケジュールし、管理します。また、BigQuery Omni を使用すると、Google Cloud とアマゾン ウェブ サービスにまたがるデータを分析できます。
  • API、フラット ファイル、オンプレミスの自社データ: 顧客管理(CRM)や PoS(Point Of Sale)などのソースからデータを取り込めます。通常、このデータの取り込みは、bq コマンドライン ツールまたは BigQuery APIまたはコンソールを使用してオフラインで行います。データはローカルで、または Cloud Storage から読み込めます。大規模なデータセットの場合、Cloud Storage を使用して、帯域幅の使用、ネットワーク速度、プロダクト統合を最適化することをおすすめします。イベント ドリブンのデータを BigQuery に読み込むには、Cloud Functions のトリガーを設定します。たとえば、新しいデータの可用性に基づいてトリガーを設定します。

前述の取り込みアプローチのほとんどは、バッチ読み込みを使用します。ストリーミング データセットを BigQuery に取り込むには、BigQuery のストリーミング機能を使用します。ストリーミング分析のユースケースについては、ストリーミング分析ソリューションをご覧ください。

データ処理

データを取り込んだ後は、必要に応じてデータを処理できます。このステージは、データに対してクエリを実行する前にデータを処理する必要がある場合にのみ必要です。データ処理には、ビッグ データセットの整合性を確保するためのクリーニングと再フォーマットが含まれます。Google Cloud 内でデータ処理プロダクトを使用できます。

ユーザーに応じて、適切な Google Cloud プロダクトを選択します。たとえば、次のようなユーザータイプとおすすめのプロダクトについて考えてみます。

  • 抽出、変換、読み込み(ETL)データ パイプラインを構築するデベロッパーは、Cloud Data Fusion データ統合プロダクトを使用できます。Cloud Data Fusion には、ELT(抽出、読み込み、変換)と ETL データ パイプラインをコードなしでデプロイできる UI があります。
  • マーケティング分析をサポートするデータ エンジニアリング チームは、Dataflow を使用できます。Dataflow を使用すると、バッチとストリーミングの両方のデータソースを大規模に取り込み、分析できます。
  • データ アナリストは Dataprep by Trifacta を使用して、BigQuery で分析を行うデータを視覚的に探索、クリーニング、準備できます。

機械学習

システムがデータの取り込みと処理を行ったら、次のユースケースで Google AI Platform のプロダクト オプションを使用できます。

  • 頻度がキャンペーンあたり、ユーザーあたりのコンバージョンに与える影響についての記述的分析: この情報により、特定のユーザーのリストに基づいて、リマーケティング キャンペーンのターゲティング頻度を調整できます。BigQuery はキャンペーン マネージャー 360 の元データにアクセスできるため、この情報を利用できます。
  • 特定のユーザーのライフタイム バリューに対する予測分析: 特定のユーザー グループの価値を予測する場合は、マーケティング キャンペーンを実行して売り上げを増やすことができます。たとえば、ブランド エンゲージメントが制限されているユーザー グループでは、ユーザーのエンゲージメントが高いほど購入の可能性が高いことがわかります。この分析情報は、データを結合して ML で顧客セグメントを構築し、ライフタイム バリューを予測することで得られます。
  • 商品に対する感情についての処方的分析: 不正確なターゲティングを防ぐために、テキストのコメントや評価の推移を分析します。この分析により、ユーザー グループが特定の特性を持つ製品をどのように受け取るかを予測できます。たとえば、感情を予測するために、感情分析と顧客セグメンテーションを使用できます。

BigQuery の統合マーケティング データを使用すると、ニーズに合った AI Platform プロダクトを選択できます。組織の ML の成熟度とスキルセットに基づいて、次のいずれかのプロダクトを選択してください。

  • 組織で ML に精通されていない場合は、AutoML を使用してお客様の ML モデルをビルドしてデプロイできます。たとえば、AutoML Tables を使用して、顧客が離脱する可能性やライフタイム バリューなどの回帰モデルと分類モデルを構築できます。
  • 組織に SQL スキルがある場合、BigQuery ML では、SQL 構造を使用してオーディエンス セグメンテーション モデルなどのモデルを作成、評価、予測できます。BigQuery からデータを移動せずに、多くのサポート対象モデルをトレーニングしてデプロイし、ML ワークフローを実行できます。
  • 組織にデータ サイエンティストのチームが存在する場合は、Vertex AI を使用して最適化されたモデルを大規模に構築してデプロイできます。Vertex AI を使用して顧客のライフタイム バリューを解決する方法の例については、AI Platform を使用したお客様のライフタイム バリューの予測をご覧ください。

分析情報と有効化

Google Cloud のオプションを使用すると、統合された広告とマーケティング データから分析情報を得ることができます。その後、データ(差別化されたセグメントなど)を Google アナリティクスやメール マーケティングなどのプラットフォームに戻すことができます。Google Cloud には、必要に応じてデータを操作する複数の方法が用意されています。たとえば、差別化されたセグメントを、Google アナリティクスや Salesforce などの任意のチャネルに戻すことができます。

Google マーケティング プラットフォーム用 Looker

また、エンタープライズ ビジネス インテリジェンス(BI)プラットフォームである Looker を使用して、分析情報を確認して共有することもできます。Looker を使用すると、複数のデータセットの組み合わせ、クロスチャネルの顧客の行動の追跡、属性による顧客のセグメント化ができます。

Looker を使用して次の分析情報を生成できます。

  • 投資収益率(ROI)分析: キャンペーンによって発生した費用と収益について理解します。
  • アラート: 戦術または広告が失敗した場合にメール通知アラートを受信するカスタムルールを設定します。
  • クロスチャネル アトリビューションの分析: マーケティング チャネル間での顧客の行動の傾向を特定します。
  • A/B テスト: 統計的に有意な結果に基づいて、バリエーションがユーザーの主な行動にどのように影響するかを分析します。
  • ユーザー獲得チャネル: 新しい見込み顧客やユーザーの流入元をトラッキングできます。
  • コホート分析: データをセグメント化して、さまざまなセグメントの経時的な動作を分析します。

Looker のブロックとアクションは、Google マーケティング プラットフォームの広告とウェブデータのための堅牢で共有可能な分析の基盤です。これらのカスタマイズ可能なブロックとアクションにより、インタラクティブなデータ探索、軽量 ML 予測を含む新しいデータのスライス、Google マーケティング プラットフォームに戻る活性化パスが提供されます。アクティベーション パスを使用すると、自社データを使用してオーディエンスを効果的にターゲット設定できます。

次の図は、Google プロダクトが Looker と連携する仕組みを示しています。

プロダクトが Looker と連携する仕組み。

この図は、Looker で Google アナリティクス 4、Google アナリティクス 360、キャンペーン マネージャー 360、および BigQuery 内のデータを使用して、リアルタイム レポートを作成する方法を示しています。Actions for Ads(カスタマー マッチ)とアナリティクス(データ インポート)を使用して、Google マーケティング プラットフォーム内の Looker から自社データを有効にできます。IAM などの業種共通サービスは、マーケティング データ パイプラインを継続的にモニタリングします。

カスタム統合

また、Google Cloud を使用してカスタム統合を構築し、任意のプラットフォームにデータを push することもできます。たとえば、スケジュールされたクエリを実行して、アナリティクス データでオーディエンス リストを生成し、API 呼び出しでデータを push できます。たとえば、Cloud Storage で新しいセグメントの準備ができたら、Cloud Functions を使用してデータの push をトリガーします。

次のステップ