Built with BigQuery: Tinyclues と Google Cloud がマーケティング担当者にとって必要な CDP の機能を提供している方法
Google Cloud Japan Team
※この投稿は米国時間 2022 年 10 月 8 日に、Google Cloud blog に投稿されたものの抄訳です。
編集者注: この投稿は、Built with BigQuery を活用した素晴らしいパートナー様をご紹介するシリーズの一部です。
カスタマー データ プラットフォーム(CDP)とは何か、なぜ必要なのか
現在では、お客様はブランドの情報を得る際、さまざまなデバイスを活用しています。たとえば、最後にシャツを購入したときのことを考えてみてください。地下鉄で通勤中に、まずスマートフォンで検索するかもしれません。その 20 分間で、シャツの種類を絞り込んでいきます。その後、昼休みに仕事用のノートパソコンで、さらに数分かけて検索を行ったところ、気になる 2 タイプのシャツを見つけました。昼休みが終わりそうだったので、両方ともオンライン小売店のショッピング カートに入れ、後で確認することにしました。帰宅後、郵便物を確認していると、お目当てのシャツが地元の実店舗で販売されている広告を偶然見つけました。翌日、昼休みにその店舗を訪れ、シャツを購入します。
マーケティング担当者の多くは、前述の例のように、カスタマー ライフサイクルを把握する一貫性のある包括的な顧客情報を作成するうえでの課題に直面しています。これにはオンラインやオフラインでの商品検索や、複数のデータソースにわたる複数のデータポイントとのやり取りが含まれます。
顧客データ管理の進化は、90 年代後半に、既存顧客および見込み顧客との接点をマッチングさせる CRM(顧客関係管理)ソフトウェアによって転機を迎えました。その後、データドリブン マーケティングの基盤として、データ管理プラットフォーム(DMP)によってデータ管理の範囲が拡大され、匿名 ID を含むセカンド パーティおよびサードパーティのデータセットも管理の対象となりました。カスタマー データ プラットフォームでは、こうした 2 つのタイプのシステムを組み合わせ、チャネル(モバイル、ウェブなど)全体で統合された永続的な顧客情報を作成し、個人レベルでのデータの可視性と粒度を提供します。


マーケティング担当者を後押しする新しいアプローチ
Tinyclues は、マーケティング担当者が顧客生涯価値を低下させることなく、顧客の持続的なエンゲージメントを促進し、さらなる収益を上げるための支援を専門に行っている企業です。同社は 2010 年、B2C マーケティングに関するデータベースには、マーケティング担当者が顧客と接点を持つ方法を変えるのに十分な量の非明示的な情報(明示的な行動とは無関係なデータ)が含まれていて、ディープ ラーニング(人間の学習方法を再現する高度な機械学習)に基づく新しい分野のアルゴリズムが、このデータの潜在能力を引き出す力を秘めている、というシンプルな直感のもと、創立されました。これまで、この分野に携わる別の企業は、わずかな明示的な過去の行動と、それ以上に仮定を基に判断をしてきました(今もそうです)。Tinyclues の予測エンジンでは、マーケティング担当者が利用可能なすべての顧客データを使用して、SKU レベルに至るまで非常に精度の高いモデルを構築しています。Tinyclues のアルゴリズムは、消費パターンの変化をリアルタイムに検出し、それに応じて予測を適応させるように設計されています。
マーケティング担当者は、このテクノロジーを活用することで、すべての時間帯のあらゆる商品に対して最適な顧客を見つけて商品へのエンゲージメントを高め、最終的には収益につなげることができます。さらに、顧客は自分に必要なメッセージだけを受け取ることができるため、顧客の負担やオプトアウトは減少させながら、キャンペーンのボリュームを増やすことができます。また、Tinyclues のテクノロジーによって、キャンペーンの作成やプランニングに費やす時間を 80% 以上削減できます。これは、手作業による顧客の獲得から脱却し、貴重な社内リソースを転用できるためです。
BigQuery をはじめとする Google Cloud のデータ プラットフォームでは、CDP の次世代を構築する、サーバーレスでスケーラビリティに優れた、費用対効果の高い基盤を提供します。
Tinyclues アーキテクチャ:


Tinyclues は、このスケーラブルなソリューションをクライアントに提供するために、製品テーブルとユーザー テーブルに加えて、購入ログとインタラクション ログをクライアントから受信しています。多くの場合、このデータはすでにクライアントの BigQuery インスタンスにあり、その場合、BigQuery の承認済みビューを利用して簡単に Tinyclues と共有できます。
BigQuery にデータがない場合は、GCS 経由でフラット ファイルを Tinyclues に送信し、軽量な Cloud Functions を介してクライアントのデータセットに取り込みます。すべてのパイプラインのオーケストレーションは、Cloud Composer(Google のマネージド Airflow)を介して実装されます。データの変換は、Data Built Tool(DBT)のシンプルな SELECT ステートメントを利用することで行われ、これは、すべてのデータの正規化と変換を担う Airflow DAG 内にラップされています。他にも、より多くの機能を実現するために、次のようないくつかの DAG が用意されています。
GCP の Elastic Cloud(Elasticsearch マネージド サービス)上で商品カタログをインデックス登録し、以下のように TC のクライアントにオートコンプリート検索機能を提供します。


SFMC、Braze、Adobe、GMP、Meta のいずれを使用しているかにかかわらず、Tinyclues を活用した顧客のデータをクライアントのアクティベーション チャネルにエクスポートします。


Google Vertex AI を活用した Tinyclues AI / ML パイプライン
傾向スコアを算出するモデルのトレーニングには TC の ML トレーニング パイプラインを使用します。これらは、Tensorflow と Vertex AI Pipelines を活用した Airflow DAG を使用して構成されています。データの移動なしで BigQuery がネイティブに使用され、可能な限りインプレースで特徴量エンジニアリングを実行します。
TC では、TFX ライブラリを使用し Vertex AI で ML Pipeline を実行します。Tensorflow は、その成熟度、オープンソース プラットフォーム、スケーラビリティ、複雑なデータ構造(不規則なスパース テンソル)のサポートによって、主要なディープ ラーニングのフレームワークとして選択され、構築の基盤となっています。
以下は、TC の Vertex AI Pipelines グラフの一例で、トレーニング パイプラインにおけるワークフローの手順を示したものです。このパイプラインを使用することで、機能をモジュール化、標準化し、管理しやすい構成要素に変換します。これらの構成要素は、TFX のコンポーネント(TC では標準コンポーネントの大半を再利用する)で構成されています。さらに、ML 指標(標準的な実装の一部)だけでなく、クリックしたユーザーの重複といったビジネス指標も算出する評価ツールの独自実装などのカスタマイズも行われています。個々のコンポーネントや手順は DSL を使用して結合され、モジュール化されたパイプラインを形成し、必要に応じて簡単にオーケストレーションまたはアップデートできます。


TC では GCS で利用可能なトレーニング済みの Tensorflow モデルを BigQuery ML(BQML)で公開することで、クライアントが数分以内に X または Y を購入する傾向について数百万人のユーザーをスコアリングできるようにします。これは BigQuery の機能を活用することによってこそ実現されるものであり、TC はこれまで抱えていたスケーラビリティの問題から解放されます。
実例として、TC では数百万人のユーザーの中で数千のトピックをスコアリングする必要があります。TC でカスタム アルゴリズムに実装された最適化作業と、あらゆるワークロードに応じてスケーリングを行う BQ の優れた機能により、以前のスタックでは 20 時間以上もかかっていましたが、今では 20 分未満で完了できます。
データ グラビティ: パラダイムを変える - データにモデルを導入する
BQML によって、TC では事前トレーニング済みの TensorFlow モデルを SQL 環境内で呼び出すことが可能になります。これにより、すでにプロビジョニングされた BQ のサーバーレスな処理能力を使用して、BQ 内外へのデータのエクスポートを回避できます。BQML を使用することで、モデルとデータ ウェアハウス間のレイヤーを取り除き、推論パイプライン全体を多数の SQL リクエストとして明示できます。TC ではもう、モデルに読み込むためのデータをエクスポートする必要はありません。代わりに、データにモデルを導入します。


BQ 内外のデータのエクスポートを避け、サーバーレスでマシンのプロビジョニングと起動を行うことで、大幅な時間短縮を実現しています。たとえば、大規模なクライアントの 1,100 万行のキャンペーンをエクスポートするのに以前は 15 分以上かかっていました。BQML にデプロイしてからは数分で処理できるようになり、その処理時間の半分以上は、クライアント システムへのネットワーク転送に起因するものです。
BQML の推論時間と TC の従来のスタックの比較:


ご覧のように、BQML によって実現されるアプローチを取って手順を簡略化することで、全体の推論時間を 50% 削減し、各手順における予測を改善しました。
論より証拠
Tinyclues は、CRM チームの自律性の向上、迅速な顧客の獲得、社内セグメントに対する優れたパフォーマンス、利用されていないメッセージと収益機会の特定、負担管理などの約束を一貫して果たしてきました。また、Tiffany & Co、楽天、Samsung をはじめとする多くのパートナーと連携しています。


まとめ
Google のデータクラウドは、Tinyclues が開発したヘッドレス CDP ソリューションのようなデータドリブンなアプリケーションを構築するのに適した完全なプラットフォームを提供します。データの取り込み、処理、保存の簡素化から強力な分析、AI、ML、データ共有機能まで、すべてがオープンかつ安全でサステナブルな Google Cloud Platform と統合されています。多様なパートナー エコシステムと、オープンソース ツール、API を備えた Google Cloud を活用することで、テクノロジー企業が次世代のマーケティング部門のお客様にサービスを提供するために必要な移植性と差別化要因を提供します。
Google Cloud 上の Tinyclues の詳細については、Tinyclues をご覧ください。Google Cloud の Built with BigQuery イニシアチブの詳細については、こちらをクリックしてご確認ください。
この継続的なデータプラットフォームのコラボレーションとレビューに尽力してくれた多くの Google Cloud チームメンバー、特にパートナー エンジニアリング担当の Ali Arsanjani 博士に感謝します。
- Cloud パートナー エンジニアリング担当プリンシパル アーキテクト Christian Williams
- Tinyclues、ビジネス開発担当ディレクター Gregoire Blond 氏