Google Cloud Next Tokyo:7/30、31 東京ビッグサイトにて開催!

時系列予測とは

時系列予測は、過去の時系列データをモデル化して将来の時点を予測する、統計的または ML 的なアプローチの一種です。

時系列予測の課題

他の種類のモデルと比較して、時系列予測には、季節性、休日効果、データのスパース性、トレンドの変化など、固有の課題があります。時系列データは順序付けされており、時間的な相関関係があるため、多くの ML 手法はここではうまく機能しません。たとえば、k 分割交差検定ではデータ リークが発生する可能性があります。新しい予測を生成するには、モデルを再トレーニングする必要があります。時間ディメンションをランダム化する機能がない場合、過学習と適合不足のバランスを取るのは難しい作業です。予測する商品が何百万点にも及ぶ可能性があるため、予測ソリューションのスケーラビリティも考慮する必要があります。予測に加えて、異常検出、不確実性の定量化、因果推論など、ビジネスにとって重要なタスクもあります。時系列予測は、タイムスタンプ付きデータに対する単なる教師あり学習ではありません。幸いなことに、Google Cloud はあらゆるビジネスニーズに対応する幅広いソリューションを実現しています。

たとえば、大規模な小売店では、需要が高いときに在庫を確保し、需要が低いときに過剰在庫にならないように、数百万のアイテムを予測する場合があります。

時系列予測のユースケース

需要予測とキャパシティ プランニング

小売商品の需要予測

小売商品の需要を予測するエンドツーエンドのソリューションを構築します。販売履歴データを使用して BigQuery ML で需要予測モデルをトレーニングし、データポータル(旧 Looker Studio)ダッシュボードで予測値を可視化して関係者と共有します。需要予測で食品廃棄物を削減する方法をご覧ください。

商品価格の予測

時系列モデルは、ビジネスや生産プロセスにとって重要な商品の価格を予測し、キャッシュ フローモデルと財務計画に関する情報を提供するために使用されます。

キャッシュフロー予測

時系列モデルは通常、回帰モデルおよび分類モデルと組み合わされ、過去の会計時系列と、取引データや契約上の義務による入力に基づいて、高精度のキャッシュ フロー予測を生成します。ここでは、BigQuery ML で ARIMA_PLUS を使用し、GLM、ブーストツリーモデル、AutoML などの BigQuery ML の教師ありモデルと組み合わせることができます。

異常検出

需要予測での異常検出

祝日や贈り物の時期、年末のセールなどに、利用額が増えることが予想されます。しかし、予想外の急増(または谷)がある場合にはどうすればよいでしょうか。たとえば、予想外に高い(あるいは低い)需要を発見するにはどうすればよいでしょうか。BigQuery ML で異常を検出して、自転車レンタルの異常な急増を検出する方法を確認します。これは、ロンドン市で公共交通機関の運行が中断された日と一致します。

製造品質管理と指標モニタリング

IoT センサーから生産出力まで、指標のモニタリングにはさまざまな形式があります。ただし、共通の要素は、これらの指標の典型的な範囲を予測し、モニタリング システムを導入して事前に計画を立て、できるだけ早く対応できるようにすることです。

異常検出のその他の一般的なユースケースには、誤った価格設定による価格異常、リアルタイムの異常検出、製造品質管理などがあります。

因果推論

広告効果

広告がビジネスのリフトの生成にどの程度効果的に働いたのか。因果推論により、広告キャンペーンの統計的有意性を調べることができます。

主要なイベントが時系列に与える影響

英国の EU 離脱などの主要なイベントが時系列に与えた影響が統計的に有意かどうかを知りたい場合があります。因果推論により「英国の EU 離脱の投票が英国ポンドと米ドルの為替レートにどう影響したか」を確認する方法をご覧ください。

因果推論分析のその他の分野には、プロモーション、インセンティブの効果、価格弾力性の推定などがあります。

Google Cloud での時系列予測

BigQuery ML

BigQuery ML を使用すると、BigQuery で標準 SQL クエリを使用して機械学習モデルを作成して実行できます。時系列予測と異常検出のタスクを実行するために、ARIMA_PLUS というモデルタイプをサポートしています。

BigQuery ML の ARIMA_PLUS モデリングを使用すると、データ ウェアハウスから離れることなく、単一の SQL クエリ内で数百万の時系列を予測できます。

ARIMA_PLUS は本質的に時系列モデリング パイプラインであり、次の機能が含まれています。

  • 時系列のデータ頻度を推測する
  • 欠損データ、不規則な時間間隔、重複するタイムスタンプを処理する
  • 外れ値の急増や急減、急激なレベルの変化を検出して調整する
  • 休日の影響、季節性、トレンドに対処する

1 つのクエリで数千万の時系列を一度に予測できます。十分な BigQuery スロットが利用可能であれば、さまざまなモデリング パイプラインが並行して実行されます。

BigQuery ARIMA_PLUS の使用を開始するには、次のチュートリアルをご覧ください。

詳細については、BigQuery ML 一般公開ドキュメントをご覧ください。

Vertex Forecast

Vertex Forecast には、ユーザーが時系列予測モデルをトレーニングするための複数のオプションが用意されています。

  1. AutoML モデル。AutoML のトレーニングでは、最初にさまざまな特徴量エンジニアリングのアプローチが適用され、高速のハイパーパラメータ検索が実行され、AutoML で Google 所有のモデルを含む多くの高度なモデル アーキテクチャが探索され、最終的に高品質なモデルを生成します。
  2. Seq2seq plus。トレーニング プロセスでは、特にシーケンスツーシーケンス モデル アーキテクチャ内のハイパーパラメータを使用します。これにより、ハイパーパラメータ探索空間の範囲を縮小し、迅速な収束を実現できます。

詳細については、Vertex Forecast の公開ドキュメントをご覧ください。

Vertex Forecasting のチュートリアルを利用して、開始できます。

カスタム予測

独自のカスタムコードを使用しながら、Google Cloud でトレーニング / サービング インフラストラクチャを活用する場合は、Vertex AI Notebooks を使用して、Python、R、TensorFlow、PyTorch のコードを実行できます。

TimesFM 1.0(Time Series Foundation Model)

TimesFM(Time Series Foundation Model)は、Google Research が単変量時系列予測のために開発した、事前トレーニング済みの時系列基盤モデルです。

1.0 リリースには、2 億パラメータのチェックポイントとその推論コードが含まれています。これは Transformer ベースのモデルで、1,000 億を超える実世界のタイムポイントを含む事前トレーニング済みデータセットでデコーダのみの形式でトレーニングされています。コンテキストの長さ(最大 512 タイムポイント)と任意のホライズンの長さに対して、オプションの頻度インジケーター入力を使用して、単変量時系列予測を実行します。

ユースケース: 時系列予測 - モデルは、単変量の時系列と、オプションの頻度パラメータをコンテキストとして入力します。モデルは、任意の長さの将来のホライズンに時系列を予測します。

Vertex AI Model Garden で利用可能

一変量予測と多変量予測

一変量予測では、過去の時系列データのみを使用して将来のデータを予測します。たとえば、明日のニューヨーク市の気温を予測する場合、一変量予測では、単一の変数である過去の気温のみを使用して将来の気温を予測します。一変量予測では、季節的なパターンや傾向を把握することもできます。

多変量予測では、複数の要素を使用して将来のデータを予測します。たとえば、明日のニューヨーク市の気温を予測するには、過去の気温を使用するだけでなく、気圧、UV 指数、近隣地域の被雲率、風速などの変数も使用できます。

Google Cloud のソリューションを活用してみませんか。課題をともに解決しましょう。

Google Cloud を使用して組織の予測を変革する方法をご覧ください。
実践的な学習を行い、時系列予測の Codelab を今すぐお試しください。

BigQuery ML が組織にどのように役立つかをご覧ください。 ドキュメントを見る

次のステップ

$300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。

Google Cloud