コンテンツに移動
データ分析

Earth Engine ラスター分析で BigQuery の地理空間機能を拡張

2025年5月20日
Sheba Rasson

Senior Product Manager

Jeremy Malczyk

Cloud Geographer

Try Gemini 2.5

Our most intelligent model is now available on Vertex AI

Try now

※この投稿は米国時間 2025 年 5 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。

Google Cloud Next 25 で、Google は地理空間分析において大きな一歩となる BigQuery の Earth Engine を発表しました。この新しい機能により、Earth Engine のラスター分析を BigQuery で直接実行できるようになり、衛星画像から得られた地理空間データセットの高度な分析を SQL コミュニティに提供できます。

この新機能の詳細と、それによってどのようにユースケースを強化できるかについて説明していきますが、その前に、まずは 2 つの地理空間データのタイプと、従来から Earth Engine と BigQuery が優れていた点を確認しておくといいでしょう。

  • ラスターデータ: このタイプのデータは、セルまたはピクセルのグリッドとして地理情報を表します。各ピクセルには、標高、気温、土地被覆などの特定の属性を表す値が格納されます。ラスターデータの代表的な例は衛星画像です。Earth Engine はラスターデータの保存と処理に優れており、複雑な画像の分析と操作を可能にします。

  • ベクターデータ: このタイプのデータは、ポイント、ライン、ポリゴンなどの地理的対象物を表します。ベクターデータは、建物、道路、管理境界などの個別のオブジェクトを表現するのに最適です。BigQuery はベクターデータの保存とクエリにおいて非常に効率的であるため、大規模な地理分析に適しています。

Earth Engine と BigQuery はどちらも、それ自体が強力なプラットフォームです。両方の地理空間機能を組み合わせることで、ラスター分析とベクター分析の両方の長所を 1 か所に集約できます。そこで、BigQuery の現在の地理空間機能を拡張した BigQuery の Earth Engine 機能を作成しました。これにより、より多くの人がラスター分析を実行でき、実際に企業が抱えているさまざまな問題にこれまで以上に簡単に対応できるようになります。

BigQuery の Earth Engine: 主要な機能

BigQuery の Earth Engine の 2 つの主要な機能を使用することで、BigQuery でラスター分析を実行できます。

  • BigQuery の新しい関数: 新しい BigQuery 地理関数である ST_RegionStats() を実行すると、指定した地理的境界内のラスターデータから統計情報を効率的に抽出できます。

  • BigQuery Sharing(旧 Analytics Hub)の新しい Earth Engine データセット: BigQuery Sharing(旧 Analytics Hub)で増え続ける Earth Engine データセットのコレクションにアクセスし、データの検出とアクセスを簡素化します。これらのデータセットの多くは分析にすぐ使用できる状態となっており、対象地域の統計情報を導き出して、標高、排出量、リスク予測などの有用な情報を提供します。

ラスター分析の 5 つの簡単なステップ

新しい ST_RegionStats() 関数は、Earth Engine の reduceRegion 関数に似ており、画像の 1 つ以上の地域の統計情報を計算する際に使用できます。ST_RegionStats() 関数は、BigQuery SQL 式の一部として呼び出される BigQuery の地理関数セットに新たに追加された関数です。地理情報で示される対象地域(郡、土地区画、郵便番号など)と Earth Engine でアクセス可能なラスター画像を取得し、指定された地理情報と交差するピクセルの集計値セットを計算します。対象地域の集計統計の例としては、特定の郡の最大洪水深度や平均メタン排出量などが挙げられます。

対象地域について有意義な分析情報を得るための 5 つのステップは次のとおりです。

  1. ベクターデータを含む BigQuery テーブルを特定する: 管理境界(郡、州など)、顧客の所在地、または対象となるその他の地理的地域を表すデータを指します。BigQuery の一般公開データセットからデータセットを取得することも、ニーズに応じて独自のデータセットを使用することもできます。

  2. ラスター データセットを特定する: BigQuery Sharing で Earth Engine ラスター データセットを検索するか、Cloud GeoTiff または Earth Engine 画像アセットとして保存されているラスターデータを使用できます。後者の場合、ベクター境界内で分析する情報を含む任意のラスター データセットを指定できます。

  3. ST_RegionStats() を使用してラスターデータを BigQuery に取り込む: ST_RegionStats() 地理関数は、ラスターデータ(raster_id)、ベクター ジオメトリ(geography)、オプションのバンド(band_name)を入力として受け取り、交差するラスターデータとベクター対象物の集計値(平均、最小値、最大値、合計、件数など)を計算します。

  4. 結果を分析する: ST_RegionStats() を実行して得られた出力を使用してラスターデータとベクター対象物の間の関係を分析することで、対象地域に関する有益な分析情報を生成できます。

  5. 結果を可視化する: 地理空間分析は、通常、地図上に可視化すると最も効果的です。BigQuery Geo Viz などのツールを使用すると、分析結果を表示するインタラクティブな地図を簡単に作成できるため、空間パターンの理解や結果の共有が簡単になります。

データドリブンな意思決定に向けて

BigQuery の Earth Engine を利用できるようになったことで、これまで BigQuery では利用できなかったデータセットのラスター分析が可能になり、さまざまな地理空間やサステナビリティのユースケースにおいてデータドリブンな意思決定を大規模に行う際に新たな可能性が生まれます。これらのデータセットは、新しい地理関数 ST_RegionStats() と組み合わせて、特定の管理境界内におけるさまざまな土地被覆タイプの計算や開発候補地内の平均標高適合性分析など、多様なユースケースに使用できます。また、これらのデータセットのサンプルクエリは、BigQuery Sharing の個々のデータセット ページでも確認できます。たとえば、GRIDMET CONUS Drought Indices データセット ページに移動すると、カリフォルニア州の各郡の Palmer Drought Severity Index(PDSI)平均値を計算するサンプルクエリを確認できます。このインデックスは、米国全土の干ばつ状況をモニタリングするために使用されます。

この新しい機能によって実現されるユースケースをいくつか詳しく見ていきましょう。

1. 気候、物理的リスク、災害対応

ラスターデータから、気象パターンや自然災害のモニタリングに関する重要な分析情報を取得できます。BigQuery Sharing で利用可能なラスター データセットの多くは、洪水マッピング、山火事リスク評価、干ばつ状況などに関する派生データを提供します。これらの分析情報は、災害リスクと対応、都市計画、インフラストラクチャ開発、交通管理などに活用できます。たとえば、Wildfire Risk to Communities データセットを予測分析に使用して、山火事のリスク、コミュニティの被災状況、脆弱性要因を評価し、効果的な回復戦略を策定できます。洪水マッピングでは、Global River Flood Hazard データセットを使用して米国で浸水深度が最も深くなると予測される地域(つまり地表からの水位)を把握できます。

2. サステナブルな調達と農業

ラスターデータは、時間の経過に伴う土地被覆や土地利用の変化に関する分析情報も提供します。BigQuery の新しい Earth Engine データセットには、地形、標高、土地被覆の分類に関する派生データが含まれており、これらはサプライ チェーン管理や農業、食料安全保障の評価に不可欠な入力データとなります。グローバル市場で事業を展開する企業にとって、サステナブルな調達にはサプライ チェーンへの透明性と可視性が求められます。規制要件により、商品生産における森林破壊ゼロへの取り組みが任意から必須に移行している現状ではなおさらです。新しい Forest Data Partnership のカカオ、パーム油、ゴムに関する地図を使用すると、時間経過に伴う商品の栽培地の変化を分析でき、Forest Persistence または JRC Global Forest Cover データセットを追加して、2020 年以前に森林伐採や劣化が起きていない地域で農産物が栽培されているかどうかを把握できます。たとえば、シンプルな SQL クエリを使用して、2020 年にインドネシアの土地面積のうち、手つかずの森林が占めていた割合を推定できます。

3. メタン排出量のモニタリング

気候変動の速度を遅らせるためには、石油ガス産業からのメタン排出量を削減することが不可欠です。MethaneSAT L4 Area Sources データセットは、ST_RegionStats() 関数を使用して Earth Engine 画像アセットとして使用でき、小規模で分散した地域におけるさまざまな発生源からのメタン排出に関する分析情報が得られます。このような広範囲に分散した排出タイプは、石油とガスの堆積盆地におけるメタン排出の大部分を占める可能性があります。これらの排出の場所、規模、傾向を分析してホットスポットを特定し、緩和策の策定に役立てるとともに、盆地のような広い地域における排出の特徴を把握できます。

4. カスタム ユースケース

これらのデータセットに加えて、Cloud Storage GeoTiff または Earth Engine 画像アセットを介して独自のラスター データセットをインポートすることで、BigQuery のスケーラビリティと分析ツールのメリットを活用しながら、その他のユースケースに対応できます。

総合的な例

それでは、モデル化された山火事のリスクと AI を活用した天気予報技術に基づくより高度な例を見てみましょう。以下の SQL は、BigQuery Sharing にリストされている Wildfire Risk to Communities データセットを使用しています。このデータセットは、コミュニティが山火事の被害を把握し、軽減できるよう支援することを目的としています。このデータには、地域全体での山火事の発生確率と影響度を示すバンドが含まれています。国勢調査指定地域の一般公開データセットのジオメトリを使用すると、ST_RegionStats() でこのデータセットから値を計算し、コミュニティの相対的なリスクへの曝露を比較できます。また、WeatherNext Graph 予報の天気データを組み合わせて、その地域に迫る火災が発生しやすい気象状況がどのような影響を及ぼすかを予測することもできます。

まず、BigQuery Sharing コンソールに移動します。[リスティングを検索] をクリックして [気候、環境] でフィルタし、[Wildfire Risk to Community] データセットを選択(または検索バーでデータセットを検索)します。[サブスクライブ] をクリックして、Wildfire Risk データセットを BigQuery プロジェクトに追加します。次に、「WeatherNext Graph」を検索し、WeatherNext Graph データセットをサブスクライブします。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image_kNNNt96.max-1600x1600.png

これらのサブスクリプションを設定したら、クエリを実行し、多くのコミュニティにまたがるこれらのデータセットを単一のクエリで結合します。SQL WITH ステートメントを使用してこのタスクをサブクエリに分割することで、よりわかりやすくなります。

まず、前のステップでサブスクライブした入力テーブルを選択します。

次に、特定の日付と対象地域について、WeatherNext Graph の予報データを使用して天気を予測します。すると、各コミュニティ内の平均風速と最大風速が算出されます。

3 番目に、ST_RegionStats() 関数を使用して、各コミュニティの Wildfire Risk to Community ラスターデータのサンプルを取得します。ここでは地域内の平均値の計算のみを目的としているため、関数オプションでスケールを 1 キロメートルに設定して解像度の低い概要図を使用することで計算時間を短縮できます。ラスターのフル解像度(この場合は 30 メートル)で計算する場合は、このオプションを省略できます。

lang-sql
読み込んでいます...

これにより、各コミュニティ内の両方のバンドにおける山火事リスクの平均値と、1 日の間の予測風速が含まれたテーブルが作成されます。さらに、山火事のリスク、山火事の影響、最大風速の計算値を 1 つの複合インデックスにまとめ、コロラド州の選択した日付における山火事の相対的なリスクを表示することもできます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_vfkjyAx.max-1600x1600.png

各コミュニティの山火事のリスクと風速の平均値

この出力を Google スプレッドシートに保存することで、州内のコミュニティ間で山火事のリスクと影響がどのように関連しているかを可視化できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/blogpost_gemini_charts.max-2200x2200.png

山火事のリスク(X 軸)と影響(Y 軸)を風速で色分けして可視化した Google スプレッドシート

または、単一の複合インデックスを使用して BigQuery GeoViz で相対的な山火事リスクを可視化し、コロラド州の選択した日付における相対的山火事リスクを表示することも可能です。

https://storage.googleapis.com/gweb-cloudblog-publish/images/blogpost_co_geoviz.max-2000x2000.png

各コミュニティの山火事リスク、山火事の影響、最大風速の複合インデックスを示す GeoViz 地図

BigQuery の Earth Engine の今後

BigQuery の Earth Engine は地理空間分析において大きな進歩です。Google は、BigQuery でのラスター分析をさらに拡張し、サステナビリティに関する意思決定をこれまで以上に容易にしています。この新機能の詳細については、ラスターデータの操作に関する BigQuery のドキュメントをご覧ください。また、今後間もなくリリースされる BigQuery の Earth Engine の新機能にもご期待ください。

-シニア プロダクト マネージャー Sheba Rasson
-クラウド ジオグラファー Jeremy Malczyk

 

投稿先