Earth Engine の地理空間分析に加わった 8 つの機能強化点
Google Cloud Japan Team
※この投稿は米国時間 2024 年 2 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。
Google は 10 年以上前に、現代の深刻なサステナビリティの課題に対処するため、クラウドベースの地理空間処理サービスである Earth Engine をリリースしました。それ以来、環境問題の緊急性が増し続けるなか、同サービスは進化し続けており、現在では分析可能な地理空間データの量が 90 ペタバイト以上に達しています。衛星データを分析するオプションが増えたため、Google は最近、Earth Engine とその他の重要なツール、データセット、システムの効果的な連係に向けて集中的に取り組んでいます。
ここ数か月にリリースされた、Earth Engine をさらに使いやすくする 8 つの改善点および統合について以下に紹介します。
1. BigQuery
BigQuery は Google のペタバイト規模の分析データベースです。Earth Engine は画像(ラスター)の処理に重点を置いているのに対し、BigQuery は大規模な表形式データセットの処理に最適化されています。BigQuery と Earth Engine を組み合わせて使用することで、両方の特長を活かすことが可能となります。Earth Engine から BigQuery へのエクスポート コネクタについて詳しくは、Google Earth Engine と BigQuery コネクタによるサステナビリティの向上をご覧ください。
2. Python
Earth Engine ユーザーの多くは、ML やデータ分析に最もよく使われる言語である Python によってデータ分析を行うことを望んでいます。Python コミュニティでは、ML や分析に便利なツールの数々が開発されており、最近では、地理空間ワークロードにも対応するようになっています。たとえば、Cloud Optimized GeoTiff はリモート センシングのデータ向けに最適化されたファイル形式で、GeoPandas は Pandas DataFrame を拡張して一般的な地理空間関数およびプロット機能を追加したものです。
地球観測学は、本質的に視覚的な体験です。パンやズームはもちろん、画像の一点をクリックしてバンド値を調べたり、地図上にポリゴンを描写してゾーンの統計情報を視覚化したりすることなどは、すべて科学ワークフローにおける重要な操作です。Earth Engine におけるこれらの操作は最近まで JavaScript ベースのコードエディタでのみサポートされていましたが、このたび、Colab または Jupyter のノートブック環境でコードエディタの多数の機能を提供する Python ライブラリ geemap が公式にサポートされることになりましたのでお知らせいたします。このライブラリは 2020 年 4 月、Google Developer Expert である Qiusheng Wu 博士によって開発されました。詳しくは、Python Powers Up: The Rise of the Python API for Earth Engine(Python がパワーアップ: Earth Engine 向け Python API の登場)をご覧ください。
3. データの抽出
TensorFlow モデルをトレーニングするときや、水文学のシミュレーションを Earth Engine 以外で実行したい場合など、Earth Engine のデータを別のシステムに取り出したいことがあります。これまでどおり、Earth Engine のエクスポート API を使って、負荷の高いデータ抽出処理を Earth Engine 側で行うこともできますが、スケーリングの問題が発生した場合や、Apache Beam、Spark、Dask などのフレームワークを使い慣れている場合は、新しいデータ抽出方法をお試しください。Python クライアント ライブラリのバンドルとして、クライアントサイドで Earth Engine オブジェクトと NumPy、Pandas、GeoPandas タイプの変換を行うロジックが提供されるようになりました。詳しくは、Pixels to the people!(人々にピクセルを!)をご覧ください。
4. Xarray
Xarray は、多次元配列の処理によく使用されるオープンソースの Python パッケージです。Xarray は Earth Engine のピクセルを処理するのに非常に便利で、Earth Engine ImageCollection を Xarray データセットとして処理することが可能です。Google Cloud は最近、Xee と呼ばれる Earth Engine と Xarray の統合を発表しました。Xee は、複数のプロセッサに処理を分散できるように、Dask と密接に統合されています。Xarray はいわゆる「遅延評価」方式であり、計算に必要なデータのみを抽出し、他の多数のシステムに接続できるのが特徴です。たとえば、Xee を使うと、天気や気候データで利用が進んでいる比較的新しいデータ形式 Zarr ファイルに Earth Engine データをエクスポートできます。
5. Vertex AI
Earth Engine からエクスポートしたデータを使って、ディープ ラーニング モデルをトレーニングして予測を行いたいことがあります。このたび Earth Engine が Vertex AI と統合されました(現在は公開プレビュー版)。この統合は、これまでの Google Cloud AI Platform との統合を置き換えるものであり、Vertex AI でモデルをホストし、Earth Engine のコードエディタ内で予測を行うことが可能となります。Vertex AI は、AI Platform よりもずっと大きな画像から予測を行えるほか、拡張性にも優れています。詳しくは、Earth Engine brings Vertex AI to the geospatial party(Earth Engine、Vertex AI を地理空間の分野に導入)をご覧ください。
6. Earth Engine 向け Erdas LiveLink
ERDAS IMAGINE は、リモート センシングの分野で高い人気を誇るソフトウェア パッケージです。Google Cloud は Hexagon と提携し、今年中に Earth Engine 向け LiveLink をリリースすることになりました。LiveLink を使うことで、Earth Engine のカタログデータをローカル コンピュータ上の限定公開データと組み合わせることができます。これにより、Earth Engine の広範なデータカタログおよびバックエンドの処理機能を活用しながら、使い慣れたインタラクティブ環境で開発を行うことが可能となります。
7. 分析を効率化する新たなデータセット
Earth Engine のデータカタログには、多様かつ有益な最新データセットが定期的に追加されており、これらを Earth Engine の他のデータやユーザーの持つ限定公開データと組み合わせて利用することが可能です。昨年新しく追加されたデータセットの数は 100 以上に上り、たとえば、JRC の森林被覆グローバル マップ(2020 年版)や、地球の地表面反射率のシームレスな記録を作成する NASA の Landsat および Sentinel-2 の調和データセットなどがあります。
8. Cloud Score+
Sentinel-2 のデータや、リモート センシングのデータ全般を扱ったことがある人なら、雲が大きな問題であるということをご存じでしょう。世界は常に Google Earth の美しい画像のように見えているわけではなく、雲に覆われているため、分析が困難です。この問題に対処するため、Google Cloud はディープ ラーニングに基づく最新技術を使って、Sentinel-2 向けの初の総合的な QA スコア Cloud Score+ を構築しました。Cloud Score+ は現在、Sentinel-2 の全コレクションに対応しています。詳しくは、All Clear with Cloud Score+(Cloud Score+ でクリアな画像を)をご覧ください。
サステナビリティに向けた取り組みは、リモート センシングのデータを Google Cloud エコシステムの他の部分と組み合わせたときに、最も効果を発揮します。Earth Engine の最新の機能強化については Google Cloud 営業担当者にお問い合わせください。2024 年の新たな展開についてもどうぞご注目ください。
-Earth Engine デベロッパー リレーションズ リード Steve Greenberg
-ソフトウェア エンジニア Nate Schmitz