コンテンツに移動
Public Sector

BigQuery で Waze と NOAA のデータを使用して事故件数や道路状況をモデル化

2023年5月18日
Google Cloud Japan Team

※この投稿は米国時間 2023 年 5 月 10 日に、Google Cloud blog に投稿されたものの抄訳です。

交通機関は、多様かつ高速なソースからもたらされる大量のデータを管理するという課題に直面しています。異なるソースから分析情報を収集するのは困難になりがちで、ましてやオペレーションに関する意思決定に十分な速さで反映させるのは難しいものです。従来、各機関はオペレーションの状況を把握するにあたり年次報告書に頼っていましたが、これでは新たな問題に迅速に対処することができません。Google では、すべての政府指導者がビッグデータからオンデマンドで分析情報を引き出すことができる未来を見据えています。Google のクラウド データ ウェアハウスである BigQuery なら、高度な技術的専門知識がなくても、データの量、統合、更新頻度に対応することができます。

ケンタッキー州交通局がデータを使用して安全確保業務を変革

たとえば、ケンタッキー州交通局(KYTC)は、HERE®、Waze、天候、道路区分の地理空間データを組み合わせようとしたため、オンプレミスの Hadoop クラスタでは対応できなくなってしまいました。そこで分析を BigQuery に統合すると、ペタバイト規模で、またストリーミング データを使用してほぼリアルタイムでレポートを作成できるようになりました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/williszhang_KYTC_ITS_2.0_DW_Architecture_1.max-2200x2200.png

データを BigQuery に統合すると、KYTC にとって新しいユースケースが現れてきました。2021 年の吹雪の際、オペレーション チームは、マテリアライズド ビューを生成して、高速道路の渋滞の兆候を効率的にモニタリングしていました。データを明確に、または具体的に提供できない可能性がある人間やサードパーティの情報源に頼らずに、データに基づいて交通の流れを推測することができたため、10 分ごとに隊員を積極的に派遣するかどうかを判断できたのです。また、公共の地図アプリケーションに、道路上で発生している事象の複数のレイヤを表示することで、一般の人々に透明性を提供するという、別のユースケースもあります。

多くの政府機関が Waze of Cities プログラムのメンバーであり、すでに BigQuery でホストされている管轄区域の 5 年間分の渋滞、警報、異常事態のデータに直接アクセスできます。Google のオンボーディング ガイドでは、道路で何が起こっているのかを把握するための優れたスターター クエリを提供しています。さらに、各機関は ML 機能と BigQuery の一般公開データセットを使用して、事象をモデル化することができます。

Waze と気象データを使用した道路状況や安全性のモデル化

概念実証として、Google Cloud の BigQuery を使用して、降水量と事故件数を相関させてみましょう。以下のクエリを使用して、米国海洋大気庁(NOAA)が提供する日々の Global Historical Climatology Network(GHCN)の降水量の数値と、Waze のアラート テーブルを結合することができます。注意点ですが、Google Cloud プロジェクトと BigQuery データセットへの「書き込みアクセス権」があることを確認してください。
lang-sql
読み込んでいます...

このクエリを構築すると、ML モデルを作成するためのトレーニング データセットが提供されます。subtype 機能を ACCIDENT_MINOR から HAZARD_ON_ROAD_POT_HOLE または HAZARD_WEATHER_FLOOD に置き換えると、これらについてさらに予測を作成することができます。

次に、以下のクエリを使って ML モデルを作成できます。

lang-sql
読み込んでいます...

モデルの特徴は、降水量(0.1 mm 単位)と平日かどうかであり、出力は予測される事故件数です。クエリが完了したら、構造化クエリ言語(SQL)テーブルのようにモデルを「クエリ」することで、このモデルを予測に使用できるようになります。

lang-sql
読み込んでいます...

結果の例は、以下のようになります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Screenshot_2023-05-03_8.13.08_PM.max-600x600.png

予測された事故件数は約 14 件です。また、各特徴が結果にどのように関係しているかをモデルが提示できるようにしています。これは、各機関がそれぞれの管轄区域において、安全性に関する成果を得るためには、どのような要因に影響を与える必要があるかを理解するのに役立ちます。

次のステップ

これらのクエリを最初のステップとして、独自のモデルの構築を開始してみましょう。BigQuery の Waze テーブルへのアクセスは、Waze Partner Hub で管理されています。追加情報や設定のサポートが必要な場合は、Google Public Sector のアカウント担当者、またはこちらまでご連絡ください


- Google Public Sector、分析担当 SLED プラクティス リード Willis Zhang
投稿先