予測の概要

予測とは、過去のデータを分析して将来の傾向を予測する手法です。たとえば、複数の店舗の過去の販売データを分析して、それらの店舗での将来の販売を予測するようなことが考えられます。BigQuery ML では、時系列データに対して予測を行います。

予測は次の方法で実行できます。

  • 組み込みの TimesFM モデルAI.FORECAST 関数を使用します。このアプローチは、単一の変数の将来の値を予測する必要があり、モデルをファインチューニングする機能が不要な場合に使用します。この方法では、モデルを作成して管理する必要はありません。
  • ARIMA_PLUS モデルML.FORECAST 関数を使用します。このアプローチは、ARIMA ベースのモデリング パイプラインを実行し、結果を説明するために時系列を複数のコンポーネントに分解する必要がある場合に使用します。この方法では、モデルを作成して管理する必要があります。
  • ARIMA_PLUS_XREG モデルML.FORECAST 関数を使用します。このアプローチは、複数の変数の将来の値を予測する必要がある場合に使用します。この方法では、モデルを作成して管理する必要があります。

ARIMA_PLUSARIMA_PLUS_XREG の時系列モデルは、実際には 1 つのモデルではなく、複数のモデルとアルゴリズムを含む時系列モデリング パイプラインです。詳細については、時系列モデリング パイプラインをご覧ください。

TimesFM モデルと ARIMA モデルを比較する

次の表を使用して、ユースケースで組み込みの TimesFM モデルで AI.FORECAST を使用するか、ARIMA_PLUS モデルまたは ARIMA_PLUS_XREG モデルで ML.FORECAST を使用するかを判断します。

機能 TimesFM モデルを使用した AI.FORECAST ARIMA_PLUS モデルまたは ARIMA_PLUS_XREG モデルを使用した ML.FORECAST
モデルタイプ Transformer ベースの基盤モデル。 トレンド コンポーネントに ARIMA アルゴリズムを使用し、トレンド以外のコンポーネントにさまざまなアルゴリズムを使用する統計モデル。詳細については、時系列モデリング パイプラインをご覧ください。
トレーニングが必要 いいえ。TimesFM モデルは事前トレーニング済みです。 はい。各時系列に対して 1 つの ARIMA_PLUS モデルまたは ARIMA_PLUS_XREG モデルがトレーニングされます。
SQL の使いやすさ 非常に良い。1 回の関数呼び出しが必要。 良い。CREATE MODEL ステートメントと関数呼び出しが必要。
使用されるデータ履歴 512 個のタイムポイントを使用。 トレーニング データのすべての時点を使用。使用するタイムポイントを減らすようにカスタマイズ可能。
精度 非常に高い。他の多くのモデルよりも優れたパフォーマンスを発揮。詳細については、時系列予測用のデコーダ専用基盤モデルをご覧ください。 非常に高い。TimesFM モデルと同程度。
カスタマイズ 低。 高。CREATE MODEL ステートメントには、次のような多くのモデル設定を調整できる引数が用意されています。
  • 季節性
  • 祝日効果
  • ステップの変化
  • トレンド
  • スパイクと低下の削除
  • 予測の上限と下限
共変量をサポート いいえ。 はい(ARIMA_PLUS_XREG モデルを使用する場合)。
説明可能性 低。 高。ML.EXPLAIN_FORECAST 関数を使用して、モデル コンポーネントを検査できます。
最適なユースケース
  • クイック予報
  • 最小限のセットアップが必要
  • モデルのファインチューニングが必要
  • モデル出力の説明可能性が必要
  • モデルの入力により多くのコンテキストが必要

BigQuery ML のステートメントと関数のデフォルト設定を使用すると、ML の知識があまりなくても予測モデルを作成して使用できます。ただし、ML 開発、特に予測モデルに関する基本的な知識があれば、データとモデルの両方を最適化して、より良い結果を得るのに役立ちます。ML の手法とプロセスに習熟するために、次のリソースの活用をおすすめします。