特徴のサービング
このドキュメントでは、BigQuery ML モデルのトレーニングと推論で特徴を使用するためのオプションについて説明します。どのオプションでも、BigQuery テーブルに特徴を保存する必要があります。
特定の時点の正確性
通常、モデルのトレーニングに使用するデータには、時間的な依存性が組み込まれています。時間的制約がある特徴の特徴テーブルを作成する場合は、行ごとに特定の時点での特徴値を表すタイムスタンプ列を含めます。これらの特徴テーブルのデータをクエリする場合は、トレーニングとサービングの間でデータ漏洩が発生しないように、時間指定ルックアップ関数を使用できます。これにより、特定の時点の正確性を確保できます。
時間的制約のある特徴を取得するときに、次の関数を使用して特定の時点でのカットオフを指定します。
BigQuery ML で特徴をサービングする
BigQuery ML でモデルをトレーニングしてバッチ推論を実行するには、特定の時点の正確性で説明されている特定の時点のルックアップ関数のいずれかを使用して特徴を取得します。これらの関数は、CREATE MODEL
ステートメントの query_statement
句(トレーニングの場合)または適切なテーブル値関数(ML.PREDICT
など)の query_statement
句(サービングの場合)に含めることができます。
Vertex AI Feature Store で特徴をサービングする
Vertex AI に登録されている BigQuery ML モデルに特徴をサービングするには、Vertex AI Feature Store を使用します。Vertex AI Feature Store は、BigQuery の特徴テーブル上で動作し、低レイテンシで特徴の管理とサービングを行います。オンライン サービングを使用すると、オンライン予測用の特徴をリアルタイムで取得できます。また、オフライン サービングを使用すると、モデル トレーニング用の特徴を取得できます。
Vertex AI Feature Store で使用する BigQuery 特徴データの準備の詳細については、データソースを準備するをご覧ください。