時系列予測とは

時系列予測は、統計的または ML のアプローチの一種で、将来の時点について予測するために過去の時系列データをモデル化しようとするものです。

時系列予測の課題

他のタイプのモデルと比較すると、時系列予測には季節性、休日効果、データの不足、トレンドの変化など、独自の課題が伴います。ここでは、時系列の連続的な性質と時間的相関のために、多くの ML 手法がうまく機能しません。たとえば、k フォールト交差検証はデータ漏洩を引き起こす可能性があります。新しい予測を生成するには、モデルを再トレーニングする必要があります。過学習と学習不足のバランスは、時間次元をランダム化できないと厄介な作業になります。予測するアイテムが数百万個に上る可能性があるため、予測ソリューションのスケーラビリティも考慮する必要があります。ビジネスには、予測に加えて、異常検出、不確実性の定量化、因果推論などのタスクが重要な場合があります。時系列予測は、タイムスタンプ付きのデータに対する教師あり学習だけではありません。幸いなことに、Google Cloud にはあらゆるビジネスニーズに応える幅広いソリューションが用意されています。

たとえば、大規模な小売店では、需要が高いときに在庫を確保し、需要が低いときに過剰在庫にならないように、数百万のアイテムを予測する場合があります。

時系列予測のユースケース

需要予測とキャパシティプランニング

商品の小売需要予測

小売商品の需要を予測するエンドツーエンドのソリューションを構築します。販売履歴データを使用して BigQuery ML で需要予測モデルをトレーニングし、Looker Studio ダッシュボードで予測値を可視化して関係者と共有します。需要予測によって食品廃棄物を削減する仕組みを確認する。

商品価格予測

時系列モデルは、ビジネスや生産プロセスにとって重要な商品の価格を予測し、キャッシュフローモデルと財務計画に関する情報を提供するために使用されます。

キャッシュフローの予測

時系列モデルは通常、回帰モデルおよび分類モデルと組み合わされ、過去の会計時系列と、取引データや契約上の義務による入力に基づいて、高精度のキャッシュフロー予測を生成します。ここでは、ARIMA_PLUS を BigQuery ML とともに使用し、GLM、ブーストツリーモデル、AutoML などの BigQuery ML の教師ありモデルと組み合わせることができます。

サプライチェーン予測
需要を促進する要因は数多くあります。流通センターでは、消費者の需要を満たすには事前の準備が重要です。Vertex AI Forecast がサプライチェーン流通センターのモデル構築を支援し、天候、商品レビュー、マクロ経済指標、競合他社の動向、商品価格、貨物料金、海上運送業者の費用などから得られるシグナルを含むモデルを構築する方法をご確認ください。

異常検出

需要予測での異常検出

祝日や贈り物の時期、年末のセールなどに、利用額が増えることが予想されます。しかし、予想外の急増（または谷）がある場合にはどうすればよいでしょうか。たとえば、予想外に高い（あるいは低い）需要を発見するにはどうすればよいでしょうか。BigQuery ML で異常を検出して、自転車レンタルの異常な急増を検出する方法を確認します。これは、ロンドン市で公共交通機関の運行が中断された日と一致します。

製造の品質管理と指標のモニタリング

IoT センサーから本番環境への出力まで、指標のモニタリングにはさまざまな形態があります。ただし、共通の要素は、これらの指標の典型的な範囲を予測し、モニタリングシステムを導入して事前に計画を立て、できるだけ早く対応できるようにすることです。

異常検出のその他の一般的なユースケースとしては、価格設定の誤りによる価格の異常、リアルタイムの異常検出、製造品質管理などがあります。

因果推論

広告の効果

ビジネスの効果を高めるうえで、広告はどの程度効果的でしたか？因果推論により、広告キャンペーンの統計的有意性を調べることができます。

主要イベントが時系列に及ぼす影響

英国の EU 離脱などの主要なイベントが時系列に与えた影響が統計的に有意かどうかを知りたい場合があります。因果推論により「英国の EU 離脱の投票が英国ポンドと米ドルの為替レートにどう影響したか」を確認する方法をご覧ください。

因果推論分析のその他の分野には、プロモーション、インセンティブ効果、価格弾力性の推定があります。

Google Cloud での時系列予測

BigQuery ML

BigQuery ML を使用すると、BigQuery で標準 SQL クエリを使用して機械学習モデルを作成して実行できます。時系列予測タスクと異常検出タスクを実行するために、ARIMA_PLUS というモデルタイプがサポートされています。

BigQuery ML で ARIMA_PLUS モデリングを使用すると、データウェアハウスから離れることなく、単一の SQL クエリで数百万の時系列を予測できます。

ARIMA_PLUS は基本的に時系列モデリングパイプラインであり、次の機能が含まれています。

時系列のデータ頻度を推測する
欠損データ、不規則な時間間隔、重複したタイムスタンプを処理する
外れ値の急増や急減、急激なレベルの変化を検出して調整する
休日の影響、季節性、トレンドに対処する

1 つのクエリで数千万の時系列を一度に予測できます。十分な BigQuery スロットが利用可能な場合、異なるモデリングパイプラインが並行して実行されます。

BigQuery ARIMA_PLUS の使用を開始するには、次のチュートリアルをご覧ください。

BigQuery ML の ARIMA_PLUS による Google アナリティクスのウェブトラフィックの単一の時系列予測
BigQuery ML ARIMA_PLUS を使用した、ニューヨーク市の自転車の移動に関する複数の時系列予測
BigQuery で数百万の時系列を使用してスケーラブルな予測を行う
BigQuery ML の ARIMA_PLUS による小売販売の需要予測

詳細については、BigQuery ML 一般公開ドキュメントをご覧ください。

Vertex Forecast

Vertex Forecast には、ユーザーが時系列予測モデルをトレーニングするための複数のオプションが用意されています。

AutoML モデル。AutoML のトレーニングでは、最初にさまざまな特徴量エンジニアリングのアプローチが適用され、高速のハイパーパラメータ検索が実行され、AutoML で Google 所有のモデルを含む多くの高度なモデルアーキテクチャが探索され、最終的に高品質なモデルを生成します。
Seq2seq プラス。トレーニングプロセスでは、特にシーケンスツーシーケンスモデルアーキテクチャ内のハイパーパラメータを使用します。これにより、ハイパーパラメータ探索空間の範囲を縮小し、迅速な収束を実現できます。

詳細については、Vertex Forecast の公開ドキュメントをご覧ください。

Vertex Forecasting のチュートリアルを利用して、開始できます。

カスタム予測

独自のカスタムコードを使用しながら、Google Cloud でトレーニング / サービングインフラストラクチャを活用する場合は、Vertex AI Notebooks を使用して、Python、R、TensorFlow、PyTorch のコードを実行できます。

TimesFM 1.0（Time Series Foundation Model）

TimesFM（Time Series Foundation Model）は、一変量時系列予測用に Google Research が開発した事前トレーニング済みの時系列基盤モデルです。

1.0 リリースには、推論コードとともに 2 億パラメータのチェックポイントが含まれています。これは Transformer ベースのモデルであり、1, 000 億を超える現実世界のタイムポイントを含む事前トレーニング済みデータセットを使用して、デコーダのみでトレーニングされています。オプションで頻度インジケーターの入力を使用して、最大 512 のタイムポイントのコンテキスト長と任意のホライズン長に対して一変量時系列予測を実行します。

ユースケース: 時系列予測 - このモデルは、入力コンテキストとして一変量時系列と、オプションのフリークエンシーパラメータを受け取ります。このモデルは、任意の長さの将来のホライズンに時系列を予測します。

VertexAI Model Garden で利用可能