Bayer Crop Science、BigQuery と geobeam を活用して土壌の状態を改善
Google Cloud Japan Team
※この投稿は米国時間 2022 年 1 月 13 日に、Google Cloud blog に投稿されたものの抄訳です。
Bayer Crop Science は、Google Cloud を使用して数十億エーカーもの土地を分析し、食用作物を生み出す土壌の性質に関する理解を深めています。同社のデータ サイエンティスト チームは、Google Cloud のさまざまなサービスを活用して地理空間データの読み込み、保存、分析、可視化を行い、独自のビジネス インサイトを導き出しています。こうした重要な作業の多くが、誰にでも利用可能な一般公開データを使用して行われています。
米国地質調査所(USGS)、米国海洋大気庁(NOAA)、米国国立気象局(NWS)などの公的機関が地表と大気の測定を大規模に行い、得られたデータを一般公開しています。ただし、こうしたデータを分析して知見や情報を抽出することは、誰にでもできることではありません。そこで、この記事では、BigQuery や Dataflow のような Google Cloud サービスを使用して地球に関する大規模な観測データを分析する、誰にでもできる簡単な方法をご紹介します。
データの結合
まず、利用可能なデータベースをいくつか見ていきます。このプロジェクトで、Bayer のチームは、全世界の土壌に関する情報を管理する 国際土壌参照および情報センター(ISRIC) が公開しているデータセットに強い関心を寄せていました。ISRIC は地球の土質の空間分布をマッピングし、土壌の pH、有機物含有量、窒素濃度など、さまざまな測定値を収集しています。集められた測定値は、大きな画像である「ラスター」ファイルにエンコードされます。この画像内のピクセルひとつひとつが地球上の特定の場所を、ピクセルの「色」がその場所の測定値を表します。1 つのラスターを 1 枚の層と考えることができ、また、おおむねデータベース内の 1 つのテーブルに相当します。多くの地球観測データセットがラスターデータとして公開されていますが、ポイント測定値のようなグリッドデータの保存には適しているものの、ラスター内の異なる領域同士や、複数のラスタータイルやラスターレイヤ同士の空間関係を把握するうえでは不便な場合があります。
データをインサイトに変換する
そこで、Bayer は Dataflow で geobeam を使用してラスターをベクターデータに変換するという難しい作業を行いました。具体的には、ラスターをポリゴン化して BigQuery で使用される WGS 84 座標系に再投影し、H3 インデックスを生成して、文字どおり点と点を結びつけました。特にポリゴン化の処理は非常に複雑で、ファイルサイズが大きくなると難易度も加速度的に増大します。ただし、Dataflow は、分割統治法を用いて大きなラスター ファイルを小さなブロックに分割し、大規模な並列処理を行うことができます。この方法では、データ量にかかわらず、従来の GIS ツールがどれほど性能の高いマシンで実行されても不可能な規模とスピードでデータの処理を行えます。特に優れているのは、最小限のカスタム プログラミング作業で、すべての処理をその場で行えることです。ラスターデータのポリゴン化、再投影、分解が完了すると、Dataflow から BigQuery テーブルにベクターデータが直接書き込まれます。
データが BigQuery に読み込まれると、Bayer は BigQuery GIS と geobeam で計算した H3 インデックスを使用して複数のテーブルのデータを結合し、あらゆる土層を表す単一ビューを作成します。この単一ビューで結合されたデータを分析し、BigQuery GeoViz を使用すると、全領域を一度に可視化できます。機械学習モデルを適用することで、人間には発見できないパターンを探すことも可能です。
GeoViz を使用した Bayer の土壌分析のスクリーンショット
ビジネスに改善をもたらす地理空間に関するインサイト
この土壌グリッドデータは、Bayer の顧客が作物を栽培する場所の土壌の特徴を知るうえで非常に重要です。世界各地の農耕地の土壌環境シナリオを計算して顧客の農地に起こっていることを把握できるようになったことで、試験ネットワークの最適化、商品の特性評価、高精度な商品設計が可能になります。また、社内の試験ネットワーク用耕作地の土壌特性を明らかにすることで、世界規模の試験ネットワークの確立、環境類似性の算出、履歴のモデル化が可能になり、Bayer の現実世界での目標にも影響をもたらしています。
Bayer Crop Science にとって、なぜ作物の栽培に関する空間分析情報の取得が画期的か、理由は容易におわかりいただけるかと思います。これと同じ戦略とツールを、さまざまな業界やビジネスに応用していただけます。
Google の使命は、世界中の情報を整理し、世界中の人々がアクセスできて使えるようにすることです。Bayer Crop Sciences のように、データを活用して自社の顧客や環境に役立つ商品やサービスを作り上げようとお考えのお客様のお役に立てることを楽しみにしています。優れた地理空間アプリケーションを作成して自社のビジネスに活用したいとお考えの場合は、Google Cloud のリファレンス ガイドをご覧ください。Google Cloud の地理空間機能に関する詳しい解説をお読みいただけます。Google Cloud Console で BigQuery を開いて、お客様の地理空間ワークロードに BigQuery と geobeam をご活用ください。
- Bayer Crop Science シニア データ エンジニア Aswin Ramakrishnan 氏
- ソリューション アーキテクト Travis Webb