コンテンツに移動
データ分析

TimesFM 基盤モデルを使用した BigQuery でのゼロショット予測

2025年7月14日
Haoming Chen

Software Engineer, BigQuery ML

Jenny Ortiz

Software Engineer, BigQuery ML

【Next Tokyo ’25】

【Next Tokyo】120 以上のセッションをアーカイブ公開中。話題の Gemini、生成 AI、AI エージェントなどの Google Cloud のアップデートや顧客事例をチェックしましょう。

視聴はこちら

※この投稿は米国時間 2025 年 7 月 10 日に、Google Cloud blog に投稿されたものの抄訳です。

正確な時系列予測は、計画、サプライ チェーン管理、リソースの割り当てなど、多くのビジネス シナリオにおいて不可欠です。現在、BigQuery には Google Research の最先端の事前トレーニング済みモデルである TimesFM が組み込まれており、シンプルな AI.FORECAST 関数を使用して高度な予測を行うことができます。

時系列分析は、小売、医療、金融、製造、科学など、幅広い分野で使用されています。予測アルゴリズムを使用することで、ユーザーは、傾向、季節変動、周期パターン、定常性などを認識し、データをより深く理解できます。

BigQuery は、時系列分析用の有名な ARIMA_PLUS モデルと ARIMA_PLUS_XREG モデルをすでにネイティブにサポートしています。最近では、事前トレーニングを経た LLM 大規模モデルの急速な進歩と成功に伴い、Google Research チームは時系列ドメイン専用の基盤モデルである TimesFM を開発しました。

時系列基盤モデル

TimesFM は、4,000 億の実際の時間ポイントで構成された大規模な時系列コーパスで事前にトレーニングされた予測モデルです。このモデルの大きな利点は、「ゼロショット」予測を実行できることです。つまり、トレーニングなしで、未知のデータセットに対して精度の高い予測を行うことができます。アーキテクチャの面では、TimesFM はデコーダのみの Transformer モデルとして構築されており、連続する時間ポイント セグメントのバッチを一度に出力します。このモデルは、さまざまなドメインと粒度の公開ベンチマークを含む GIFT-Eval ベンチマークと Monash 公開データセットで取り上げられています。ARIMA_PLUS はカスタマイズ性と説明可能性に優れていますが、TimesFM モデルは使いやすさに優れ、多くのビジネス分野で優れた一般化を実現し、カスタム トレーニングされた統計モデルやディープ ラーニング モデルを上回ることがよくあります。

BigQuery が TimesFM をサポートする仕組み

最新の TimesFM 2.0 は、BigQuery のネイティブ モデルになりました。5 億個のパラメータを持つ TimesFM モデルの推論は、BigQuery インフラストラクチャ上で直接実行されるため、モデルのトレーニング、エンドポイントの管理、接続の設定、割り当ての調整は必要ありません。BigQuery の TimesFM は高速かつスケーラブルでもあります。1 つの SQL クエリで数百万の一変量時系列を数分で予測できます。

新しい AI.FORECAST 関数の例

例として、一般公開されている bigquery-public-data.san_francisco_bikeshare.bikeshare_trips テーブルを使用するユースケースを考えてみましょう。このデータセットには、サンフランシスコ ベイエリアのシェアサイクル プログラムを利用した個々の自転車の利用に関する情報が含まれています。

例 1: 単一の時系列

次のクエリは、各日のバイクシェア利用回数の合計を集計し、次の 10 日間(デフォルトの横軸)の利用回数を予測します。

lang-sql
読み込んでいます...

結果は次のようになります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_4NbncBW.max-1200x1200.png

出力には、forecast_timestamp 列と forecast_value 列を通じて、予測タイムスタンプと予測値が含まれます。confidence_level のデフォルトは 0.95 です。prediction_interval_lower_bound と prediction_interval_upper_bound は、予測された各ポイントの範囲を示します。

例 2: 複数の時系列

AI.FORECAST 関数では、次の例に示すように、複数の時系列を一度に予測することもできます。次のクエリは、過去 4 か月間の履歴データに基づいて、次の 1 か月間(約 720 時間)の利用者のタイプ別、時間別のシェアサイクルの利用状況を予測します。

lang-sql
読み込んでいます...

結果は次のようになります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_81QIdi8.max-1200x1200.png

単一の時系列で使用される列に加えて、先ほど subscriber_type として定義した時系列識別子列があります。結果を可視化する

履歴データと予測データをマージして、結果を可視化できます。次のグラフは、「Subscriber」の時系列と、予測間隔の下限と上限を可視化したものです。

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_FUcOtIS.max-1200x1200.png

この生成に使用したクエリの詳細は、チュートリアルでご覧いただけます。

TimesFM と ARIMA_PLUS の使い分け

すぐに使用できる予測、ベースラインの確立、最小限のセットアップでの一般的な傾向の特定には、TimesFM を使用します。特定のパターンをモデル化する必要がある場合、季節性や休日の予測を細かく調整する場合、多変量(ARIMA_PLUS_XREG)の場合、説明可能な結果が必要な場合、またはより長い履歴コンテキストを活用したい場合は、ARIMA_PLUS のほうが適しています。

次のステップ

TimesFM 2.0 モデルは現在、BigQuery でプレビュー版としてご利用いただけます。詳しくは、チュートリアルドキュメントをご覧ください。

ー BigQuery ML、ソフトウェア エンジニア Haoming Chen

ー BigQuery ML、ソフトウェア エンジニア Jenny Ortiz

投稿先