コンテンツに移動
データ分析

データポータルと BigQuery GIS を使用した地理空間の分析情報の活用

2021年4月16日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Unlocking_Geospatial_Insights_Blog.max-2500x2500.png
Google Cloud Japan Team

※この投稿は米国時間 2021 年 4 月 2 日に、Google Cloud blog に投稿されたものの抄訳です。

 

データには、住所、郵便番号、GPS 座標、ビジネスに重要な場所など、なんらかの形で地理的位置に関する情報が含まれている可能性があります。しかし、このようなデータを活用してさまざまな角度から主な指標を理解できているでしょうか。これまでは、これを行うために専門の地理情報システム(GIS)ソフトウェアが必要でしたが、現在ではこうした機能は Google BigQuery に組み込まれています。位置や経路、境界線を地理空間データ型で保存し、地理空間関数を使用して操作できます。人々がこのデータを探索し、地理空間パターンを見つけられるようにするには、地図上でそれを可視化する必要があります。そこで Google Cloud では、BigQuery の GEOGRAPHY ポリゴンの階級区分図のサポートをはじめとする、データポータルの新しい機能強化を発表しました。これにより、Google マップベースのインターフェースで BigQuery GIS データを容易に可視化できます。

データポータルでの Google マップ

データポータルは、Google マーケティング プラットフォーム(BigQuery や他の何百ものデータソースに接続)が提供する、セルフサービス レポートの作成やデータの可視化が行える無料のサービスです。これを使用することで、データを視覚的に探索したり、見栄えの良いインタラクティブなレポートをデザインしたり共有したりできます。昨年の Google マップをベースにした可視化機能の追加により、Google マップと同じように地理的データを可視化して操作でき、周辺の移動や拡大、ストリートビューへのポップインが行えます。

データに地理座標が含まれていなくても大丈夫です。データポータルは、国、州、指定マーケット エリア(DMA)、都市、郵便番号、住所、その他のサポートされる地理フィールド タイプを認識できます。たとえば、Google 広告の DMA コードと指標しかない場合でも、DMA 別のクリック率を可視化することが可能です。

https://storage.googleapis.com/gweb-cloudblog-publish/images/DMAs.max-700x700.png
指定マーケット エリア別のクリック率

BigQuery の GEOGRAPHY ポリゴンの可視化

では、よく使用されている境界線以外で可視化を行いたい場合はどうすればよいでしょうか。自社の業界やビジネスにおける重要な境界線が異なる場合はどうでしょうか。場所をクラスタにグループ化し、その周囲に境界線を引く分析を行ったらどうなるでしょうか。

データポータルでの BigQuery の GEOGRAPHY ポリゴンのサポートにより、階級区分図で任意のポリゴンを可視化できるようになりました。GEOGRAPHY フィールドが含まれている BigQuery データに接続すると、地理空間データとして認識されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/geospatial_field.max-400x400.png

このデータを可視化するには、Google マップの「塗り分けマップ」可視化機能を追加します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/filled_map.max-700x700.png

その後は、地理空間フィールドで地理空間データのあるフィールドを選択するだけです。

https://storage.googleapis.com/gweb-cloudblog-publish/images/google_maps_config.max-500x500.png

場所のディメンションごとにグループ化したり、ディメンションや指標ごとに色付けしたりできます。さらに詳しくは、ステップバイステップ チュートリアルをご確認ください。

この機能を実際に使った例をいくつか見てみましょう。ここでは、地理空間データを持つデータセットが複数含まれている BigQuery の一般公開データセットを使用します。

国勢統計区のマッピング

たとえば、米国のさまざまな地域における家賃の相場を可視化するとします。家賃に費やす収入の割合については、米国国勢調査局の全米コミュニティ調査データセットから取得できます。この指標は、州、郡、大都市圏、郵便番号ごとに地図上で可視化することができますが、同じ郵便番号のエリア内でも指標にかなり差が出ている場合があります。そのため、より詳細なレベルで把握するために、国勢統計区を可視化することにします。国勢統計区の境界線は、米国境界線データセットで利用できます。これらのデータセットを結合してデータポータルで可視化することで、家賃の相場をより深いレベルで把握することが可能になります。
https://storage.googleapis.com/gweb-cloudblog-publish/images/census_tracts.max-900x900.png
ワシントン州シアトル市の国勢統計区別の家賃相場

ここでは、シアトル地域の国勢統計区が表示されており、最も家賃の高いエリアがオレンジ色で示されています。まったく別の理由により目立っている 2 つのエリアがあります。大学がある地域(安い家賃、収入が少ないか無収入の学生が多い)と、メディナ住宅街(高収入、湖畔の数百万ドルの住宅)です。

このデータを取得するクエリは、次のようになります。

lang-sql
読み込んでいます...

ニューヨーク市のタクシーゾーンのマッピング

次は、ニューヨーク市のタクシー料金を分析し、乗車場所によってチップがどのように異なるかを把握するとしましょう。ニューヨーク市ではタクシーゾーンが分割されており、その境界線をデータセットで利用します。データポータルを使用すると、ブルックリン区とクイーンズ区におけるタクシーゾーン別のチップの割合の中央値を可視化できます。
https://storage.googleapis.com/gweb-cloudblog-publish/images/taxi_zones.max-900x900.png
ニューヨーク市のタクシーゾーン別のチップの割合の中央値

この地図を見ると、マンハッタンに近いゾーンから乗車した乗客がより多くのチップを払う傾向があるという、明確な地理的パターンを確認できます。

このデータを取得するクエリは、次のようになります。

lang-sql
読み込んでいます...

この例ではタクシーゾーンを取り上げましたが、選挙区、学区、病院委託地域、洪水危険地域など、さまざまな分野やビジネスにわたって多くの特殊な境界線が存在しています。

激しいストームのクラスタリング

最後に、米国のどの地域でさまざまな激しいストームが発生する傾向があるかを把握するとします。個々のストームを可視化するのではなく、特定のエリア内における多数のストームの「クラスタ」を可視化することにします。ここでは BigQuery の 地理空間関数が役立ちます。ST_CLUSTERDBSCAN 関数を使用してストームをクラスタに割り当て、ST_CONVEXHULL 関数を使用してストームの周囲に境界線を描きます。その後、それらのポリゴンをデータポータルで可視化します。
https://storage.googleapis.com/gweb-cloudblog-publish/images/storm_clusters.max-800x800.png
激しいストームのクラスタと、最も一般的なストームの種類

この地図を見ると、ベイエリアでの洪水から、グレートプレーンズでの雹のストーム、そして中西部や東海岸での雷雨まで、激しいストームの頻度と種類が西から東へとどのように変化しているかが確認できます(激しいストームを完全に避けたい場合は、小雨はよく降るものの、激しいストームは滅多に発生しない太平洋岸北西部に住むことをおすすめします)。

このデータを取得するクエリは、次のようになります。

lang-sql
読み込んでいます...

お試しください

ぜひご自身で試してみましょう。こちらのステップバイステップ チュートリアルでは、データポータルで BigQuery ポリゴンを可視化する方法をご確認いただけます。BigQuery の一般公開データセットを探索することも、独自のデータを使用することもできます。BigQuery で地理空間データを使用する準備が整っていない場合は、BigQuery GIS の詳細をご確認いただくか、BigQuery への地理空間データの読み込みを FME でより簡単にの記事をご覧ください。

-データポータル担当プロダクト マネージャー Riccardo Muti

-データ分析および地理空間リード プロダクト マネージャー Chad W. Jennings

投稿先