特徴量の前処理の概要

特徴量の前処理は ML モデルの開発において最も重要なステップの一つで、特徴量の作成とトレーニング データのクリーニングで構成されます。特徴量の作成は特徴量エンジニアリングとも呼ばれます。

BigQuery ML は、次の 2 つのタイプの特徴量の前処理をサポートしています。

  • 自動前処理。トレーニング中に BigQuery ML が自動前処理を行います。詳しくは、特徴量の自動前処理をご覧ください。
  • 手動前処理手動前処理関数を使ってカスタム前処理を定義するには、CREATE MODEL ステートメントの TRANSFORMを使用します。また、これらの関数を TRANSFORM 句の外部で使用して、モデルを作成する前にトレーニング データを処理することもできます。

ML.FEATURE_INFO 関数を使用して、すべての入力特徴量列の統計情報を取得できます。