コンテンツに移動
データ分析

BigQuery Omni によるクロスクラウド地理空間解析のメリット

2023年6月27日
Google Cloud Japan Team

※この投稿は米国時間 2023 年 6 月 13 日に、Google Cloud blog に投稿されたものの抄訳です。

意思決定におけるテクノロジーへの依存度が高まるなか、地理空間データはこれまで以上に重要なものになってきています。地理空間データは、物資の移動の追跡、関心のある地域の特定、災害の可能性のある地域の特定など、さまざまな問題を解決するために使用できる優れたリソースです。

地理空間データは、緯度経度座標、住所、郵便番号、地名など地理的な要素を持ち、人工衛星、センサー、調査などさまざまなソースから得られるため、非常に有益なツールであり、幅広い用途で活用できます。

Google Cloud のサーバーレスなエンタープライズ データ ウェアハウスである BigQuery の大きな特徴の一つは、地理空間データを分析できることです。しかし、地理空間データは、Google Cloud だけでなく、さまざまなパブリック クラウドに置かれていることがよくあります。地理空間データに効果的にアクセスするには、各クラウド プラットフォームの機能を活用し、複数のクラウド プラットフォームにまたがるデータから知見と価値を引き出すことができる、マルチクラウド分析ソリューションが必要です。

BigQuery Omni は Google Cloud、Amazon Web Services(AWS)、Microsoft Azure などのパブリック クラウド環境に保存されているデータを転送することなく分析できる、マルチクラウド分析ソリューションです。BigQuery Omni を使えば、Google Cloud でのデータ分析に使用した SQL クエリやツールを他のクラウドでのデータ分析にも使用でき、保存ロケーションに関係なくすべてのデータから分析情報を簡単に得ることができます。複数のクラウドを利用している企業様にとって、BigQuery Omni は分析を統一し、データの価値を最適化するための優れたツールです。
https://storage.googleapis.com/gweb-cloudblog-publish/images/1_BQ_Omni_Architecture.max-1300x1300.png
BigQuery Omni アーキテクチャ

BigQuery Omni を使えば、データを Google Cloud にコピーすることなく、緯度経度座標、住所、郵便番号、地名などの位置情報または地理的要素を分析できます。たとえば、BigQuery Omni を使って配達車両のフリートデータを分析し、配達車両の場所を追跡して潜在的な問題を特定できます。

BigQuery Omni と地理空間データ分析

地理空間データを扱う場合、BigQuery Omni は、データから分析情報を取得する際に役立つ優れたツールと言えます。つまり、スケーラビリティ、信頼性、安全性に優れているため、分析を統合し、データを最大限に活用するための最適な選択肢となります。

ここでは、地理空間データのために BigQuery Omni を使用する可能性がある企業の例をいくつか紹介します。

  • 運送会社では、BigQuery Omni を使用して、車両に搭載された GPS センサーのデータを分析し、フリートの動きを追跡して潜在的な問題を特定することが可能かもしれません。

  • 小売企業では、BigQuery Omni を使用して POS システムのデータを分析し、お客様の行動を追跡してトレンドを特定することが可能かもしれません。

  • 行政機関では、BigQuery Omni を使用して気象センサーのデータを分析し、嵐の動きを追跡して洪水の危険性がある地域を特定することが可能かもしれません。

BigQuery Omni と地理空間データを併用していただくと、さまざまなビジネス上の問題の本質を見抜くことができます。BigQuery Omni と地理空間データを利用することで得られるメリットとして、具体的に以下のようなものがあります。

  • 質の高い地理空間データへのアクセス: BigQuery は、改行区切りの GeoJSON ファイルの読み込みと、地理空間データの読み込みおよびクエリをサポートします。BigQuery の一般公開データセット、Earth Engine のカタログ、米国地質調査所(USGS)などの一般公開データソースのデータを、BigQuery 環境に簡単に統合できます。Earth Engine には、衛星画像や気候データなど、分析に適したデータセットを包括的に集めた統合データカタログがあります。このデータは、SAP、Oracle、Esri ArcGIS Server、Carto、QGIS といった独自のデータソースと組み合わせることができます。

  • 地理空間データの読み込みと前処理: BigQuery には、地理空間データ型の読み込みとクエリのサポートが組み込まれており、FME Spatial ETL などのパートナー ソリューションを使用してデータを読み込むことができます。

  • 地理空間データのさまざまな型と形式での作業: BigQuery は、WKT、WKB、CSV、GeoJSON など、さまざまなファイル形式に対応しています。

  • 座標参照系: BigQuery の地理データ型はグローバルに一貫しています。つまり、データは WGS84 参照系に登録され、街区や複数の大陸にわたって分析を行うことができます。

まとめると、BigQuery Omni による地理空間分析は、地理空間データを処理、分析するための幅広い技術的機能を備えており、位置情報データを扱う必要がある企業にとって有用なツールになっています。

BigQuery Omni で地理空間データを分析する

全国に店舗を持つ大規模な百貨店チェーンを展開する小売企業を想像してください。同社はビジネスの拡大を考えており、売上が見込める地域を特定したいと考えています。そのため、特定の地理的な境界線における販売量をよりよく理解するための方法を求めています。この目標を達成するために、同社は BigQuery に組み込まれている GIS(地理情報システム)機能を利用することにしました。このデータセットを分析するために同社が取るステップは次のとおりです。

ステップ 1: AWS S3 の初期受注データセットは 554 万行で、AWS S3 上には位置情報(300 行)と郵便番号(33,144 行)のメタデータ ファイルが別途存在します。

受注 Parquet ファイル:

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_Orders_Parquet.max-1100x1100.png

位置情報と郵便番号のファイル:

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_Location_and_ZipCode.max-2000x2000.jpg

ステップ 2: BigQuery Omni を使って AWS に保存されているデータと BigQuery との接続を確立し、S3 データセットに外部からアクセスできるようにします。

AWS 用外部接続

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_External_Connection_with_AWS.max-800x800.png

受注用外部テーブル

https://storage.googleapis.com/gweb-cloudblog-publish/images/5_External_Table_for_Orders.max-1200x1200.png

位置情報用外部テーブル

https://storage.googleapis.com/gweb-cloudblog-publish/images/6_External_Table_for_Locations.max-1200x1200.png

郵便番号用外部テーブル

https://storage.googleapis.com/gweb-cloudblog-publish/images/7_External_Table_for_ZipCode.max-1300x1300.png

ステップ 3: BigQuery Omni を使用して受注と位置情報のデータセットを結合し、AWS 上でリモートでデータを集約します。このデータセットを地理空間データセットと結合することで、地理空間座標を導き出すことができます。

最終的に集約したデータセットは、23 行に削減され、23 行しかない結果データセットを持ち帰ることになります。これにより、地理空間分析のために抽出する行を何百万もの行から、わずか 23 行に減らすことができます
読み込んでいます...

地域別に集計された販売データ

https://storage.googleapis.com/gweb-cloudblog-publish/images/8_Aggregated_Sales_Data_by_Region.max-1200x1200.png

販売量データが豊富なビューを構築するために、この小売企業は地理データを地図上で可視化できるツールである BigQuery Geo Viz インテグレーションを使用しています。BigQuery Geo Viz は、Google Maps API を使用して BigQuery の地理空間データを可視化するウェブツールです。SQL クエリを実行し、インタラクティブな地図に結果を表示できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/9_GeoViz_Integrtion.max-700x700.png

BigQuery Geo ビューによる販売データ分析

ジオタグ付きデータが整備されたことで、この小売企業は地域の販売量、販売密度、時間による部門別分布、部門内分布などを BigQuery を利用して確認できるようになりました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/10_GeoView_using_GeoViz.max-1500x1500.png

航空写真

https://storage.googleapis.com/gweb-cloudblog-publish/images/11_Satellite_View.max-1300x1300.png

BigQuery Omni を利用するメリット

地理空間分析だけではなく、BigQuery Omni には以下のような多くのメリットがあります。

費用の削減: BigQuery Omni は、クラウド間のデータ転送を不要にすることで、費用削減とデータ マネジメントの簡素化を実現するため、マルチクラウド分析に役立つツールです。また、複数のクラウドにまたがるデータにアクセスして、これを分析できるため、データのレプリケーションや同期の必要が減り、ETL プロセスのさらなる簡略化とデータの整合性の改善が期待できます。

ガバナンスの統一: BigQuery Omni は、暗号化、アクセス制御、監査ログなどの機能を含む BigQuery と同じセキュリティ コントロールを使用し、不正アクセスからデータを保護できます。

分析のためのシングルペイン: BigQuery Omni は、3 つのクラウドにまたがるデータをクエリするための単一のインターフェースを提供し、データ分析のプロセスを簡素化することで、複数の分析ツールを使用する必要が減ります。

柔軟性: 対応しているクラウド ストレージ サービスのいずれかに保存されているデータを分析できるため、データのロケーションに関係なく、柔軟にデータを扱うことができます。

BigQuery Omni は、データを移動することなく、複数の参照元からデータを分析できるため、地理空間分析の貴重なツールです。これにより、時間とコストを節約でき、データをより正確に理解し、よい考えを得ることができます。ビジネスの精度、効率、意思決定を向上させる方法を探している場合、BigQuery Omni を使用して地理空間データを分析することは、有益になり得ます。

参考資料

BigQuery Omni がどのようにお客様の組織に貢献できるのかに関する詳細についてはこちらをご覧ください。


- データ・分析 Sagar Kewalramani
- データ・分析 Layolin Jesudhass
投稿先