コンテンツに移動
デベロッパー

Vertex Forecast: 概要

2022年3月8日
https://storage.googleapis.com/gweb-cloudblog-publish/images/Vertex_Forecast_iLc32Y4.max-2600x2600.png
Google Cloud Japan Team

※この投稿は米国時間 2022 年 3 月 1 日に、Google Cloud blog に投稿されたものの抄訳です。

小売業者は、商品の需要や売上を予測する必要があり、コールセンターの管理者は、担当者を雇用するために電話の件数を予測したいと考えています。ホテルチェーンは、来季のホテル客室稼働率の予測を必要とし、病院は、病床使用率の予測をする必要があります。Vertex Forecast は、これらを含む多数のビジネス予測ユースケースを正確に予測します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/Vertex_Forecast.max-2200x2200.png
クリックして拡大

一変量データセットと多変量データセット

予測データセットにはさまざまな形態とサイズがあります。

一変量データセットでは、1 つの変数をある期間にわたり観察します。たとえば、有名な航空機搭乗者数データセット(Box、Jenkins 共著(1976年)『Times Series Analysis: Forecasting and Control』531 ページ)は、一変量時系列データセットの典型的な例です。下のグラフはこの時系列の最新版で、トレンドの変動と季節パターンが明確に示されています(出典: 米国運輸省)。

https://storage.googleapis.com/gweb-cloudblog-publish/images/monthlyAirPassengerTimeSeries.max-1400x1400.png
米国における 1990~2020 年の月別航空機搭乗者数

多くの場合、ビジネス予測担当者は、多変量データセットを使用して、関連する大規模なグループを時系列で予測するという難題に直面しています。典型的な小売業やサプライ チェーンの需要計画チームは、数百もの場所や郵便番号にわたる範囲で数千件の商品の需要を予測する必要があります。その結果、数百万件の個別予測をすることになります。インフラストラクチャ SRE チームは、数百あるいは数千ものコンピューティング インスタンスとロード バランシング ノードの使用量やトラフィックを予測する必要があります。同様に、財務計画チームはたいてい、何百、何千もの顧客や事業部門の収益とキャッシュフローを予測する必要があります。

予測アルゴリズム

現在、最もよく使われている予測手法は統計モデルです。たとえば、自己回帰和分移動平均(ARIMA)モデルは、古典的な予測手法として広く使われています。BigQuery ML は、予測ユースケースのために高度な ARIMA+ モデルを提供しています。

BQARIMA+ は一変量予測のユースケースに最適です。Google アナリティクスの一般公開データセットから 1 つの時系列を予測する方法のチュートリアルをご覧ください。  

最近は、ディープ ラーニング モデルを予測に利用することが人気となっています。たとえば、前回の M5 コンペティションの勝者は皆、ニューラル ネットワークとアンサンブルを使用していました。どの手法をいつ適用するかについては議論が続いていますが、ニューラル ネットワークが予測に適していることは明白となりつつあります。

予測にディープ ラーニング モデルを使う理由

ディープ ラーニングが予測分野で最近成功している理由は、それがグローバル予測モデルだからです。データセット内の時系列ごとに個別のモデルをトレーニングする一変量(地域など)予測モデルとは異なり、ディープ ラーニングの時系列予測モデルは、数百あるいは数千もの一意の時系列から成る大規模なデータセット全体を同時にトレーニングできます。これにより、関連する商品グループの需要、関連するウェブサイトやアプリへのトラフィックなど、関連する時系列の相関関係やメタデータを学習できます。GFM としてさまざまな ML モデルを使用できますが、Vertex Forecast で使われているようなディープ ラーニング アーキテクチャは、テキストデータ、カテゴリ特徴、将来の動きがわからない共変量など、さまざまな種類の特徴を取り込むことができます。こうした機能を備えた Vertex Forecast は、時系列の数が非常に多いうえに変動する状況、ライフサイクルが短いユースケースやコールドスタート予測のユースケースに最適です。

https://storage.googleapis.com/gweb-cloudblog-publish/images/historicalforecasts.max-1600x1600.jpg
一変量モデルとグローバル予測モデル(クリックして拡大)

Vertex Forecast とは

Vertex Forecast では、ニューラルネットワーク アーキテクチャ検索のための高度な AutoML アルゴリズムを使用して、予測モデルを構築できます。Vertex Forecast は時系列データの前処理を自動化できるため、データ型やデータ変換に手をかける代わりに、データセットを BigQuery や Vertex にロードできます。そうすると、AutoML が一般的な変換を自動的に適用し、さらにはモデリングに必要な特徴の設計さえ行います。

何よりも重要なのは、Vertex Forecast はアテンション拡張畳み込みゲーティングスキップ接続など、複数のディープ ラーニング レイヤとコンポーネントを検索するということです。その後、時系列に特化したクロス検証とハイパーパラメータのチューニング技術を使用して数百のモデルを同時に評価し、特定のデータセットに適したアーキテクチャまたはアーキテクチャのアンサンブルを見つけます(汎用的な AutoML ツールは、モデル選択プロセスに漏れが生じて大幅な過学習となるため、時系列モデルの検索やチューニングには適しません)。

このプロセスは多くのコンピューティング リソースを必要としますが、試行は同時に実行されるため、特定のデータセットに適したモデル アーキテクチャを見つけるのにかかる時間が劇的に短縮されます。実際、多くの場合は、従来の手法をセットアップするより時間がかかりません。

https://storage.googleapis.com/gweb-cloudblog-publish/images/datamodeldiagram.max-600x600.png

そして何と言っても、Vertex Forecast を Vertex Workbench および Vertex Pipelines と統合したことで、GFM 予測機能の試験運用とデプロイのプロセスが大幅にスピードアップされ、必要な時間が数か月から数週間に短縮されました。また、予測機能を基本的な時系列入力から複雑な非構造化およびマルチモーダル信号まで処理できるよう、迅速に増強することも可能になりました。

Vertex Forecast の詳細については、こちらの動画をご覧ください。

Video Thumbnail

#GCPSketchnote をさらにご覧になるには、GitHub リポジトリをフォローしてください。同様のクラウド コンテンツについては、Twitter で @pvergadia をフォローしてください。thecloudgirl.dev もぜひご覧ください。



- Google デベロッパー アドボケイト Priyanka Vergadia
投稿先