Direkt zum Inhalt
Datenanalysen

Wie Bayer Crop Science mit BigQuery und geobeam die Bodengesundheit verbessert

12. September 2022
Aswin Ramakrishnan

Sr. Data Engineer at Bayer Crop Science

Travis Webb

Google Cloud Solution Architect

Kontakt

Lernen Sie unsere Lösungen mit unseren kostenlosen Versionen ganz unverbindlich kennen. Wenn Sie mehr über das Leistungsangebot von Google Cloud erfahren möchten, hilft Ihnen unser Vertriebsteam gerne weiter.

Jetzt melden

Bayer Crop Science analysiert mit Google Cloud mehrere Milliarden Hektar Land, um die Bodenbeschaffenheit der Anbauflächen für unsere Nutzpflanzen zu analysieren. Ein Großteil dieser wichtigen Arbeit basiert auf Daten von US-Behörden wie dem geologischen Forschungsinstitut USGS, dem Amt für Meteorologie und Ozeanografie NOAA und dem nationale Wetterdienst NWS, die umfangreiche Messungen der Erdoberfläche und der Atmosphäre vornehmen. Diese Messergebnisse stehen der Öffentlichkeit zur freien Verfügung, müssen aber ausgewertet werden, um daraus Informationen und Erkenntnisse zu gewinnen. 

Für den Abruf sowie die Speicherung, Analyse und Visualisierung dieser raumbezogenen Daten setzen die Datenwissenschaftler*innen von Bayer auf die Dienste von Google Cloud. Das können auch Sie: In diesem Beitrag erfahren Sie, wie sich mit Google Cloud-Diensten wie BigQuery und Dataflow selbst große Mengen an Erdbeobachtungsdaten mühelos analysieren lassen.

Daten zusammenführen

Werfen wir zunächst einen Blick auf einige der verfügbaren Datensätze. Für dieses Projekt war das Bayer-Team vor allem an einem speziellen Datensatz aus dem globalen Bodendatenbestand der ISRIC-Stiftung interessiert. Das International Soil Reference and Information Centre erstellt eine weltweite Bodenqualitätskarte und misst dafür den pH-Wert, den Gehalt an organischen Substanzen, den Stickstoffgehalt und andere chemische Eigenschaften der Böden. Diese Messdaten werden in Rasterdateien kodiert – große Bilder aus verschiedenfarbigen Pixeln, die jeweils den an einem bestimmten Punkt auf der Erdoberfläche gemessenen Wert darstellen. Sie enthalten mehrere Schichten von Rastern, die Daten aus den einzelnen Tabellen einer Datenbank abbilden. Raster sind ideal, um durch Punktmessungen erzeugte Gitterdaten zu speichern und werden häufig für die Bereitstellung von Erdbeobachtungsdatensätzen genutzt. Die räumliche Beziehung zwischen einzelnen Bereichen, Segmenten und Schichten eines Rasters ist dabei allerdings nicht leicht zu erkennen.

Daten zu Erkenntnissen verarbeiten

Deshalb wandelt Bayer die Rasterdaten mit Dataflow und geobeam in Vektordaten um, die eine Visualisierung ermöglichen. Um aus den Datenpunkten Bilder zu erzeugen, werden die Rastersegmente in Polygone konvertiert, in das von BigQuery verwendete WGS 84-Koordinatensystem reprojiziert und zu h3-Indizes verarbeitet. Vor allem die Polygonisierung ist ein sehr komplexer Vorgang, dessen Schwierigkeit mit der Größe der Datei exponentiell zunimmt. Dataflow teilt deshalb umfangreiche Rasterdateien in kleinere Blöcke auf, die dann massiv parallel verarbeitet werden. Auf diese Weise lassen sich beliebige Datenmengen wesentlich schneller konvertieren, als es auf einem einzelnen Rechner mit herkömmlichen GIS-Tools möglich wäre – und das im Handumdrehen, mit minimalem Programmieraufwand. Die Rasterdaten werden polygonisiert, reprojiziert und vollständig umgewandelt und dann von Dataflow als Vektordaten direkt in BigQuery-Tabellen geschrieben.
https://storage.googleapis.com/gweb-cloudblog-publish/images/1_bayer.max-1300x1300.jpg

Mithilfe von BigQuery GIS und den durch geobeam berechneten h3-Indizes verbindet Bayer die in BigQuery geladenen Daten über mehrere Tabellen hinweg zu einer Gesamtansicht der verschiedenen Bodenschichten. Damit können die kombinierten Daten ausgewertet, alle Schichten gleichzeitig mit BigQuery GeoViz abgebildet und mit Machine-Learning-Modellen nach Mustern untersucht werden, die für das menschliche Auge nicht erkennbar sind.

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_bayer.max-2000x2000.jpg
Screenshot der Bodenanalyse von Bayer in GeoViz

Geodaten in der Praxis

Bayer nutzt die Bodengitterdaten, um die Bodeneigenschaften in den Anbaugebieten seiner Kunden zu analysieren und die Entwicklung und den Vertrieb seiner Produkte besser auf die örtlichen Bedingungen abzustimmen. Auch bei der Analyse der Bodeneigenschaften auf den Feldern seines internen Testnetzwerks kommt diese Technologie zum Einsatz, um globale Muster bei den Umweltbedingungen zu erkennen und historische Entwicklungen abzubilden.

Es ist wenig überraschend, dass die Nutzung der Erkenntnisse aus Geodaten zum Anbau von Nutzpflanzen für Bayer Crop Science ein entscheidender Durchbruch ist. Dieselben Strategien und Tools können aber auch in vielen anderen Branchen und Unternehmen eingesetzt werden.

Google hat sich dem Ziel verschrieben, das Wissen der Welt zu organisieren und es allgemein zugänglich und nutzbringend einsetzbar zu machen. Wir freuen uns, mit Kunden wie Bayer Crop Science zusammenzuarbeiten, die ihre Daten für die Entwicklung von Produkten einsetzen, die sowohl ihren Kunden als auch der Umwelt zugutekommen.

Wenn auch Sie daran interessiert sind, innovative Geodatenanwendungen für Ihr Unternehmen zu entwickeln, werfen Sie einen Blick in unsere Referenz zu den raumbezogenen Funktionen von Google Cloud. Mit BigQuery und geobeam finden Sie alle dazu nötigen Anwendungen in der Google Cloud-Konsole.

Gepostet in