コンテンツに移動
デベロッパー

Google トレンドのデータを使った情報に基づく意思決定

2021年8月3日
Google Cloud Japan Team

※この投稿は米国時間 2021 年 7 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。

数週間前、Google は Google Cloud の一般公開データセット プログラムに新しいデータセットをリリースしました。Google トレンドです。Google のデータセット プログラムに慣れていないお客様もアクセスしてご自身の分析に統合できるよう、BigQuery および Cloud Storage 内にさまざまなデータセットをホストしています。Google はこうしたデータセットの保存費用を負担し、bigquery-public-data プロジェクトなどを経由してデータを一般提供しています。料金は、データに対するクエリにのみ発生します。さらに、毎月 1 TB までは無料です。加えて、まもなくすべての一般公開データセットが Analytics Hub を通じてアクセスおよび共有できるようになります。

Google トレンドのデータセットは、Google が所有する検索データをこのプログラムに初めて追加したものです。Google トレンドのデータを利用すると、ユーザーは Google 検索全体における特定のトピックや検索キーワードへの関心を、米国全土から都市にいたるさまざまなレベルで測定できます。データセットの詳細はこちらを、Looker ダッシュボードの詳細はこちらをご覧ください。これらのテーブルは、それ自体が非常に価値のあるものですが、他の実用的なデータと組み合わせることでチームにとってまったく新しい可能性の扉を開くことができます。本稿でご説明するクエリを表示または実行されたい場合はこちらをご覧ください。

Video Thumbnail

重要な地域にフォーカスする

上位 25 件の検索キーワードが top_terms テーブルに毎日追加されます。さらに、その検索キーワードが Nielsen の指定マーケット エリア®(DMA)の地域ごとに、時間の経過に伴ってどのように変動してきたかという情報がスコアとともに記録されます。値 100 がその検索キーワードの人気のピークです。この地域ごとの情報により、組織にとって有益なトレンドをより詳しく知ることができます。

仮に、各小売店舗に関する情報を含む BigQuery テーブルがあるとします。別のブログ投稿で以前お伝えしたように、BigQuery にデータを取り込む方法に応じ、Google Maps Geocoding API を使用してテキストベースのアドレスを経緯度の座標に変換することで、ベーステーブルを強化できます。
https://storage.googleapis.com/gweb-cloudblog-publish/images/unnamed_35.max-600x600.png

では、このデータを Google トレンドのデータと結合するにはどうしたらいいでしょうか。ここで BigQuery GIS 関数と一般公開境界データセットの登場です。DMA テーブルを使用して、各店舗がどの DMA に位置しているかを調べることができます。それから、DMA ID を使用してトレンドデータに再び結合し、各店舗の上位 3 件の検索キーワードにフォーカスします。このデータは、過去 1 週間以内にその地域で最も高いスコアを獲得したキーワードに基づいています。

読み込んでいます...

https://storage.googleapis.com/gweb-cloudblog-publish/images/Screen_Shot_2021-06-30_at_6.40.43_PM.max-500x500.png

こうした情報から、サービスを展開している地域のお客様にとって最も重要なトレンドを把握できるため、マーケティング活動、ストックレベル、従業員体制を最適化できます。さらに、全店舗を比較して、キーワードに対する関心がどれほど似通っているかを確認することで、地域密着型の商品開発に新しいアイデアが生まれるかもしれません。

関連する検索キーワードのフィルタリング

検索キーワードは絶えず変化し続けているため、チームがキーワードを 1 つずつ詳しく調べるのは現実的ではないかもしれません。それよりは、自分たちに関連するキーワードの分析に注力したほうがいいでしょう。ではここに、すべての商品名を含んだテーブルがあるとしましょう。商品名の中には、長いものや、今回の分析には不要な単語やフレーズを含むものがあります。例:

「10oz Authentic Ham and Sausages from Spain」

たいていのテキストの問題と同様に、前処理から始めるべきでしょう。ここでは、シンプルなユーザー定義関数を使用します。この関数は、文字列を小文字に変換してトークン化し、数字を含む単語と、ハードコードしたストップワードおよび形容詞を削除するよう定義します。

読み込んでいます...

より堅牢なソリューションが必要な場合は、NLTK in Python などの自然言語処理パッケージを使用することをおすすめします。単語を加工して語幹のみを使用したり、同義語を見つけて検索に含めたりできます。次に、商品テーブルをトレンドデータに結合して、商品名に含まれる単語を含む検索キーワードを選択できます。

読み込んでいます...

https://storage.googleapis.com/gweb-cloudblog-publish/images/Screen_Shot_2021-06-30_at_7.42.04_PM.max-800x800.png

ユーロ 2020 の影響で「スペイン対クロアチア」が最近のトレンドだったようです。この情報は、新しいキャンペーンを打ち出し、勢いに乗る絶好のチャンスかもしれません。「スペインがクロアチアに勝利し、次のラウンドに進出。本場スペインのハムを購入して応援しよう!」

さらに、昨日(本記事の執筆は 6 月 30 日)からの検索キーワードの上位を見てみると、人物名が多いことに気づきます。しかし、こうした人たちがいったい誰で、なぜ急上昇キーワードになっているのかはわかりません。わかっているのは、ブランド契約を結ぶ歌手を探しているということです。具体的に言うと、ハムの新しい CM ソングが完成したので、会社に注目を集めてくれる今流行の歌手を探しているのです。

Wikipedia Open API を使用すると、「Jamie Lynn Spears」などのキーワードでオープンサーチを実行できます。

https://en.wikipedia.org/w/api.php?action=opensearch&search=jamie+lynn+spears&limit=1&namespace=0&format=json 

これにより、検索で返された最初のウィキペディアのページの名前を含む JSON レスポンスが返されるので、そのレスポンスを使用して API に対してクエリを実行できます。

https://en.wikipedia.org/w/api.php?action=query&prop=extracts&exintro&titles=Jamie_Lynn_Spears&format=json

ここから、該当ページの最初の文を取得できます(補足: この文で、検索した人物が歌手かどうかがわかります)。「Jamie Lynn Marie Spears (born April 4, 1991) is an American actress and singer.(ジェイミー・リン・スピアーズ(Jamie Lynn Spears、1991 年 4 月 4 日 - )は、アメリカ合衆国の女優、歌手)」

以上の流れをまとめると次のようになります。まず、テーブルから新しい BigQuery 検索キーワードを選択する Google Cloud Functions の関数を作成します。そして、そのキーワードに対して Wikipedia API を呼び出して記事の最初の文を取得し、「singer(歌手)」という単語を検索します。ヒットしたら、テーブルに検索キーワードを追加します。サンプルコードはこちらをご確認ください。これにより、今最も流行している歌手が誰なのかを追うだけでなく、スコア履歴を使用して歌手たちが与える影響が時間の経過とともにどのように変化していくかを確認することもできます。

最新情報を通知で受け取る

このようなクエリは、さまざまなビジネス上の意思決定に利用できます。商品名に加えて、競合他社の名前も合わせてモニタリングしておくと、業界で台頭してきている新進企業に対して競合分析を開始できます。歌手ではなくスポーツ選手とブランド契約を結ぶことを検討しているなら、スポーツ界の新星たちを把握したいと思うでしょう。いずれにせよ、新しいトレンドが意思決定に影響を与える可能性があるなら、それを通知してほしいと思うはずです。

他の Google Cloud Functions の関数を使用すると、任意の SQL クエリをプログラムで実行し、その結果をメールで受け取ることができます。Cloud Scheduler を使用して、その関数が毎朝実行されるようにしておけば、一般公開データセットに新しいトレンドが追加されるので、常にアンテナを張った状態でいられます。このソリューション実装の詳細はこちらをご覧ください。

さっそく始めてみましょう。

独自のプロジェクトで新しい Google トレンド データセットを確認できます。BigQuery のご使用が初めての場合は、BigQuery サンドボックスを使用してプロジェクトを立ち上げてみてください。トレンドデータは、他のすべての Google Cloud 一般公開データセットと同様に、Analytics Hub で利用可能になる予定です。2021 年第 3 四半期にリリース予定のプレビュー版のご利用は g.co/cloud/analytics-hub からお申し込みください。


-デベロッパー アドボケイト Shane Glass

-デベロッパー アドボケイト Leigha Jarett
投稿先