予測の概要
予測とは、過去のデータを分析して将来の傾向を予測する手法です。たとえば、複数の店舗の過去の販売データを分析して、それらの店舗での将来の販売を予測するようなことが考えられます。BigQuery ML では、時系列データに対して予測を行います。
予測は次の方法で実行できます。
- 組み込みの TimesFM モデルで
AI.FORECAST
関数を使用します。このアプローチは、単一の変数の将来の値を予測する必要があり、モデルをファインチューニングする機能が不要な場合に使用します。この方法では、モデルを作成して管理する必要はありません。 ARIMA_PLUS
モデルでML.FORECAST
関数を使用します。このアプローチは、ARIMA ベースのモデリング パイプラインを実行し、結果を説明するために時系列を複数のコンポーネントに分解する必要がある場合に使用します。この方法では、モデルを作成して管理する必要があります。ARIMA_PLUS_XREG
モデルでML.FORECAST
関数を使用します。このアプローチは、複数の変数の将来の値を予測する必要がある場合に使用します。この方法では、モデルを作成して管理する必要があります。
ARIMA_PLUS
と ARIMA_PLUS_XREG
の時系列モデルは、実際には 1 つのモデルではなく、複数のモデルとアルゴリズムを含む時系列モデリング パイプラインです。詳細については、時系列モデリング パイプラインをご覧ください。
TimesFM モデルと ARIMA
モデルを比較する
次の表を使用して、ユースケースで組み込みの TimesFM モデルで AI.FORECAST
を使用するか、ARIMA_PLUS
モデルまたは ARIMA_PLUS_XREG
モデルで ML.FORECAST
を使用するかを判断します。
機能 | TimesFM モデルを使用した AI.FORECAST |
ARIMA_PLUS モデルまたは ARIMA_PLUS_XREG モデルを使用した ML.FORECAST |
---|---|---|
モデルタイプ | Transformer ベースの基盤モデル。 | トレンド コンポーネントに ARIMA アルゴリズムを使用し、トレンド以外のコンポーネントにさまざまなアルゴリズムを使用する統計モデル。詳細については、時系列モデリング パイプラインをご覧ください。 |
トレーニングが必要 | いいえ。TimesFM モデルは事前トレーニング済みです。 | はい。各時系列に対して 1 つの ARIMA_PLUS モデルまたは ARIMA_PLUS_XREG モデルがトレーニングされます。 |
SQL の使いやすさ | 非常に良い。1 回の関数呼び出しが必要。 | 良い。CREATE MODEL ステートメントと関数呼び出しが必要。 |
使用されるデータ履歴 | 512 個のタイムポイントを使用。 | トレーニング データのすべての時点を使用。使用するタイムポイントを減らすようにカスタマイズ可能。 |
精度 | 非常に高い。他の多くのモデルよりも優れたパフォーマンスを発揮。詳細については、時系列予測用のデコーダ専用基盤モデルをご覧ください。 | 非常に高い。TimesFM モデルと同程度。 |
カスタマイズ | 低。 | 高。CREATE MODEL ステートメントには、次のような多くのモデル設定を調整できる引数が用意されています。
|
共変量をサポート | いいえ。 | はい(ARIMA_PLUS_XREG モデルを使用する場合)。 |
説明可能性 | 低。 | 高。ML.EXPLAIN_FORECAST 関数を使用して、モデル コンポーネントを検査できます。 |
最適なユースケース |
|
|
推奨される知識
BigQuery ML のステートメントと関数のデフォルト設定を使用すると、ML の知識があまりなくても予測モデルを作成して使用できます。ただし、ML 開発、特に予測モデルに関する基本的な知識があれば、データとモデルの両方を最適化して、より良い結果を得るのに役立ちます。ML の手法とプロセスに習熟するために、次のリソースの活用をおすすめします。