Built with BigQuery: True Fit のデータ ジャーニーがパートナーの成長のきっかけに
Google Cloud Japan Team
※この投稿は米国時間 2022 年 11 月 3 日に、Google Cloud blog に投稿されたものの抄訳です。
編集者注: この投稿は、Built with BigQuery を活用した素晴らしいパートナー様の事例を紹介するシリーズの一部です。
「True Fit は、ほぼリアルタイムの適用性を持つ ML モデルで、買い物客が適切なサイズの洋服や靴を見つけられるよう支援して、彼らに素晴らしいショッピング体験を提供しています。これにより、小売店には高いコンバージョン率と収益の可能性、さらには、実行可能な主要ビジネス指標を提供します。BigQuery と Analytics Hub は、大量のデータの処理、コア ML モデルの適合、複雑で時間のかかるエコシステムの削減、お客様との容易なデータ交換などを可能にする私たちの力を、何倍にもしてくれました」 - True Fit、最高技術責任者、Raj Chandrasekaran 氏
True Fit は過去 12 年の間に、アパレルおよびフットウェアの小売業者向けに、世界最大のデータセットを構築しました。8,000 万人以上もの買い物客の購買および嗜好情報が、小売業者のグローバル ネットワークを通じ、17,000 ものブランドのデータと結び付けられています。このデータセットは、洋服や靴をオンラインで購入する買い物客に合わせたパーソナライズを強化し、マーケティング、マーチャンダイジング、製品開発、e コマース戦略に役立つ強力なデータとインサイトを小売業者に提供します。
データの収集、関連付け、分析は、小売業者のビジネスが成長、拡大するためのスマートなビジネス上の意思決定の基礎となるものです。これは、データ パッケージを活用して、ブランドや製品を購入する消費者をターゲットにしたいと考える小売業者にとっては、特に重要です。市場がデジタル化し、顧客内シェアをめぐる競争が激化し、消費者がよりパーソナライズされたショッピング体験を期待するようになった現在、データから意味のある分析情報を導き出すことは、小売業者にとってさらに力を入れるべき課題となってきています。
しかし、インフラストラクチャのコストの最適化と共有データの安全性を確保して、企業間でさまざまな規模のデータセットをスケーラブルに共有するにはどうしたらよいでしょうか。データの物理的移動のような複雑で時間のかかるプロセスを経ずに、自社の環境にアクセスしてデータを利用するにはどうしたらよいでしょうか。また、企業は、データを自社のビジネスニーズに合わせて活用する方法をどのように見つけていけばよいでしょうか。こうした疑問を解決するために、True Fit は、Google および Built with BigQuery イニシアチブと提携しました。
BigQuery や Analytics Hub といった Google Cloud のサービスは、小売業者のパートナーとのデータ パッケージの取り込みから配信に至るまで、True Fit がデータ ライフサイクル全体を最適化するのに不可欠なものとなっています。BigQuery は、フルマネージドおよびサーバーレスで、制限なく拡張可能なデータ ウェアハウス ソリューションです。また、複数の Google Cloud プロダクトとの強固なインテグレーションも実現しています。BigQuery を搭載した Analytics Hub を使えば、生産者のためのデータ交換を簡単に作成でき、買い物客のデータの検出と消費が簡潔になります。Analytics Hub マーケットプレイスで利用できるより多くのデータセットを用いて、エクスチェンジを通じて共有されたデータをさらに強化できます。
上の図を使って、それぞれのステージのプロセスがどのようになっているかを見てみましょう。
イベント取り込み - True Fit は、Fluentd を使用した Cloud Logging により、ロギング イベントをデータセットとして BigQuery にストリーミングしています。BigQuery 独自のリアルタイム ストリーミング機能により、True Fit エコシステム全体のすべてのアクティビティをリアルタイムでデバッグおよび分析できます。
非正規化 - スケジュールされたクエリをセットアップして、イベントログの正規化されたデータを取得し、非正規化されたコアテーブルに変換します。これらのテーブルは容易にクエリでき、複雑なテーブル結合をしなくても、BI アナリストやデータ サイエンティストの研究の支援に必要なあらゆる情報を含んでいます。
集計 - スケジュールされたクエリと BigQuery のテーブルの直接更新を組み合わせて、データが取り込まれると即座に集計が作成、更新されます。レポートは常に最新で、古いデータを気にすることなく配信を行えます。
アラート - True Fit アーキテクチャ全体にわたって、リアルタイムの集計を活用したアラートが設定されています。これらのアラートは、データの不一致や欠落があった場合に True Fit に通知するだけでなく、パートナーから提供されたデータにエラーがあった場合にも通知するよう構成されています。例えば、製品カタログが小売業者からすでに提供されている特定のしきい値を下回ると、小売業者に通知します。アラートは、メール、SMS メッセージ、あるいは小売業者がデータ提供に利用する True Fit UI でのリアルタイムのポップアップ通知など、多岐にわたります。
安全な配信 - エクスチェンジは Analytics Hub で作成されます。データセットは、1 つまたは複数のリスティングとしてエクスチェンジにパブリッシュされます。パートナーは、リンクされたデータセットとしてリストに登録することで、データにすばやくアクセスし、それに基づいて行動できます。これにより、マーケティングから買い物客用の chat bot、さらには買い物客の閲覧行動に基づいたリアルタイムの商品のおすすめに至るまで、さまざまなユースケースが実現します。Analytics Hub を使えば、シンプルでわかりやすい IAM ロールを使用して、特定のパートナーに共有したいデータのみを True Fit で公開することができます。パートナー専用に作成されたデータセットの特定のリスト上で、パートナーのサービス アカウントに組み込みの Analytics Hub のサブスクライバー ロールを追加すると、パートナーだけがそのデータにアクセスできるようになります。API キーや認証情報を管理する時代はもう終わりです!
BigQuery に切り替える前、True Fit のオリジナルのデータレイクは Apache Hive を使用して構築されていました。約 450 TiB のデータレイクからリアルタイムにデータを抽出することは、非常に困難な作業でした。データ パッケージが主要な小売業者のパートナーに提供されるまで約 24 時間かかり、レポートやデータ パッケージの大規模な作成にも影響を及ぼしていました。データ パッケージが利用可能になった後でも、サイズや形式の問題から、パートナーがこうしたデータ パッケージをダウンロードし、自社のデータ ウェアハウスにインポートして活用するのは簡単ではありませんでした。さらに、データの有用性にも疑問が呈されるようになってきました。データ パッケージの提供時間の長さゆえ、データが最新ではなくなり、データ不一致を警告することも難しくなっていたからです。
BigQuery を導入することで、True Fit はイベント発生時に同じデータ パッケージをリアルタイムで作成できるようになり、新しいマーケティングの機会が広がりました。また、小売業者のパートナーは、Analytics Hub によってプロセスが非常に使いやすくなったことを評価しています。既存のデータ ウェアハウスで、リンクされたデータセットとしてデータが「出現」するからです。
True Fit は Analytics Hub を通じて、小売業者のパートナー向けに多数の BigQuery データ パッケージを公開しています。これにより、パートナーは、今まで利用できなかった性能をさらに超える方法で、自社の買い物客向けにパーソナライズしたオンサイトおよびメールのキャンペーンを生成できます。
以下は、True Fit のパートナー企業が True Fit のデータ パッケージを利用してキャンペーンをパーソナライズする方法の一例です。パートナーは、以下のようなことが可能になります。
過去数週間に特定の商品を閲覧した、希望するカテゴリの True Fit の買い物客をリアルタイムで検索
買い物客のユーザー属性データおよびカテゴリのアフィニティに対する理解が深まる
指定した買い物客に対し、在庫のある特定の商品のサイズとフィット感のおすすめを取得したり、その商品にぴったりな買い物客を True Fit に判断させたりすることが可能
在庫のある、限定生産品のスタイルとサイズを True Fit の買い物客にマッチさせる
True Fit ネットワークにおいて買い物客が最近閲覧または購入した商品に基づいて、メールやオンサイト トリガーを強化
リアルタイムのデータを活用してさらなる成長を目指したいとお考えの小売業者の方は、ぜひ True Fit が提供するデータ パッケージをチェックしてみてください。
Google Cloud を利用した True Fit についてさらに詳しくは、https://www.truefit.com/business をご覧ください。
ISV にとっての Built with BigQuery のメリット
Google は、2022 年 4 月に Google Data Cloud Summit の一環として開始した Built with BigQuery プログラムを通じて、True Fit のようなデータドリブンな企業が Google のデータクラウド上で革新的なアプリケーションを構築できるよう、テクノロジーへのシンプルなアクセス、有益な専任のエンジニアリング サポート、共同市場開拓プログラムなどの支援を行っています。参加企業には以下のメリットがあります。
Google が資金提供した事前構成済みのサンドボックスを使って、すぐに構築に着手できます。
ISV センター オブ エクセレンスの専任エキスパートから、重要なユースケース、アーキテクチャ パターン、ベスト プラクティスについてのインサイトを得て、プロダクトの設計とアーキテクチャを加速できます。
共同マーケティング プログラムを利用して、認知度の向上、需要の創出、導入の拡大を図り、より大きな成功を実現できます。
BigQuery は、Google Cloud のオープンかつ安全でサステナブルなプラットフォームに統合された、パワフルでスケーラビリティの高いデータ ウェアハウスのメリットを ISV に提供します。Google が提供する巨大なパートナー エコシステムと、マルチクラウド、オープンソース ツール、API のサポートを利用すれば、テクノロジー企業は、データ ロックインを回避するために必要な移植性と拡張性を得ることができます。
Built with BigQuery の詳細については、こちらをクリックしてご確認ください。
この継続的なコラボレーションとレビューに貢献した多くの Google Cloud と True Fit チームのメンバー、特に True Fit の CTO である Raj Chandrasekaran 氏と Cloud Partner Engineering の Sujit Khasnis に感謝します。
- True Fit シニア ソフトウェア アーキテクト Shaun Haerinck 氏