CARTO と BigQuery による店舗位置データの活用
Google Cloud Japan Team
※この投稿は米国時間 2023 年 3 月 3 日に、Google Cloud blog に投稿されたものの抄訳です。
小売企業は、地理空間データを格納してさまざまな課題の解決に使用しています。位置に関連付けられたデータは、顧客について理解したり、ビジネス上の問題を解決したりするのに不可欠です。リース担当のディレクターとして、新しい店舗の位置を決めなければならないと仮定します。潜在顧客のユーザー属性、ライバル店が販売している商品、来店パターンを理解する必要がありますが、そのようなデータは空間的位置に関連付けられていなければ事実上使いものになりません。
データに空間次元を追加すると新しい可能性が広がりますが、複雑さの度合いも増します。地理空間データには、地図ベースの可視化、特有の関数とプロシージャ、平均的なデータよりはるかに大きい保存容量が必要です。この理由から、地理空間データを使用してビジネス上の問題を解決しようとする企業にとっては、CARTO などのロケーション インテリジェンス プラットフォームや、BigQuery などのペタバイト規模のデータ ウェアハウスが不可欠な要素になっています。
CARTO for Retail は、地理空間データで小売企業を支援するために開発されたプラットフォーム コンポーネントと分析関数のセットです。CARTO for Retail の関数は BigQuery で直接デプロイされ、空間分析と BigQuery ML ツールを組み合わせて、データと同じ場所で予測と分析を実行します。CARTO for Retail Reference Guideに、後述するこのソリューションの詳細が記載されています。
CARTO プラットフォームのコンポーネント
CARTO プラットフォームは、BigQuery の処理能力と組み合わせることによって CARTO for Retail ソリューションを形成するさまざまな機能を提供しています。各コンポーネントの役割を下の図に示します。
可視化
CARTO Builder は、ウェブベースのドラッグ&ドロップ分析ツールです。このツールを使用すれば、地理空間データを地図上にすばやく表示できます。組み込みの空間関数を使用して検出分析を実行できます。この関数は処理を BigQuery に任せるため、利用者側の構成を変更する必要はありません。BigQuery に送信されるコマンドを操作したい場合は、SQL インターフェースを開いて、直接コードを編集できます。このため、CARTO Builder は、地理空間アプリケーションのプロトタイプを短期間で制作するための優れたツールと言えます。
きめ細かなアクセス制御やカスタム フィルタリングなどの高度なアプリケーション機能を追加する準備が整ったら、deck.gl フレームワーク(CARTO がバックエンドで使用する)と CARTO for React を使用してプロトタイプのコードに追加できます。初めて使用する場合に役に立つテンプレートへのリンクも含まれています。
データ
ほとんどの企業は独自に地理空間データの一部を生成しているだけで、全体を知るための手段(毎日何十万台ものドローンが空に浮かんでいる様子を想像してください)を持っている企業はごくわずかです。現在の位置データに新しい位置データを追加してみてはどうでしょう。CARTO の Data Observatory は、社会人口統計情報、スポット、歩行者交通と道路交通、行動データ、クレジット カード トランザクションなどのキュレートされたサードパーティ データ(一部は無料、ほとんどが有料)を提供しています。すべてのデータがすでに BigQuery でホストされているため、既存のデータと簡単に結合できます。BigQuery 自体にも、OpenStreetMap などのさまざまな一般公開されている地理空間データセットが付属しています。
分析
CARTO Analytics Toolbox には、一連の小売特有のユーザー定義関数とストアド プロシージャが含まれています。これらのプロシージャは、CARTO の Analytics Toolbox for BigQuery と呼ばれており、CARTO プラットフォームを通して、または、BigQuery コンソールからアクセスできます。BigQuery の高い計算能力を生かして、次のような分析ができます。
クラスタリング
顧客、ライバル店、既存の店舗を地理的にクラスタリングすることによって最適な店舗位置を特定するための分析。商用ホットスポット
周辺の小売構造に基づいて、拡大に最も効果的なエリアに焦点を当てるためのモデル。ホワイトスペース分析
最も売り上げの多い店舗より期待収益が高く、重要なビジネス基準を満たしている、最も可能性の高い位置を特定するためのルーチン。ツインエリア分析
最も売り上げの多い店舗に最も似ている位置に、ネットワーク拡張戦略の焦点を当てるための ML を活用した分析。店舗収益予測
予定店舗位置の年間収益を予測するためのトレーニング済みの ML モデル。ストア カニバリゼーション
新しい店舗が既存の店舗ネットワークと重なる可能性のあるエリアや空間特徴を推定するためのモデル。
例
稼働中の CARTO for Retail コンポーネントを見てみましょう。この例の目的は、オースティンにある売り上げの多い特定の店舗に匹敵するテキサス州内の同様のエリア(ツインエリアと言う)を特定することです。まず、サービス アカウントを使用して、BigQuery への接続を確立します。
次に、carto.BUILD_REVENUE_MODEL_DATA 関数を使用して、データモデルを構築する必要があります。この関数は、店舗、収益データ、ライバル店を取り込んでから、ツインエリア、トレードエリア(半径、走行時間、カスタム作成ポリゴンなどの任意のポリゴンにできる)、必要なエンリッチメント変数を見つけるための評価グリッドを作成します。この関数の例を以下に示します。次に、carto.BUILD_REVENUE_MODEL を使用して、収益モデルを構築する必要があります。これは、BigQuery ML を使用してモデル予測を実行し、LINEAR_REG と BOOSTED_TREE_REGRESSOR をサポートします。詳細については、モデルのドキュメントを確認してください。
これは、モデルのパフォーマンスを理解するために、モデル、SHAP 値、モデル統計情報を出力します。これを実行するためのクエリの例を以下に示します。
最後に、ツインエリアを予測できます。地図上で識別可能なターゲット インデックスを選択します。図に示しているこのセルは、同様のエリアを見つけたるための、最も売り上げの多い店舗です。
ここから、主成分分析(PCA)に基づくツインエリア モデルを実行できます。ターゲット H3 セル、調査対象とするセル(テキサス州内の店舗を含まないセル)の 2 つ目のクエリ、結果を微調整するためのその他の引数を含むクエリを示します。
結果として、地理空間係数に基づいてターゲット店舗に匹敵する売り上げを挙げる可能性のあるトップエリアを示すこのインタラクティブ マップが得られます。最初のステップで、面積や建築年などの場所固有の詳細を追加するための他の店舗係数を含めることもできます。
次のステップ
信じられないかもしれませんが、ほとんどの地理空間データを作成できるツールや関数はまだまだたくさんあります。これらについては、CARTO for Retail Reference Guide を参照してください。BigQuery Tiler と、CARTO のすぐに使える Site Selection Application があります。これらには、関連するサードパーティ データ、高度な地図可視化、ネットワーク拡張に最適な位置を示すための埋め込みモデルが含まれています。
CARTO Analytics Toolbox に加えて、BigQuery には、地理空間データを分析するためのさまざまな追加の GIS 関数も付属しています。BigQuery での空間保存クラスタリングの最適化に関するこのブログを参照してください。ラスターデータの分析を検討している場合や CARTO の Data Observatory で必要なデータセットが見つからない場合は、Google Earth Engine の使用をご検討ください。