ML.QUANTILE_BUCKETIZE 関数
このドキュメントでは、連続する数値特徴を分位に基づいてバケットに分割できる ML.QUANTILE_BUCKETIZE
関数について説明します。
TRANSFORM
句で使用すると、同じ分位が自動的に予測に使用されます。
構文
ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()
引数
ML.QUANTILE_BUCKETIZE
は次の引数を取ります。
numerical_expression
: バケット化する数値式。num_buckets
:numerical_expression
を分割するバケット数を指定するINT64
値。
出力
ML.QUANTILE_BUCKETIZE
はバケットの名前を含む STRING
値を返します。返されたバケット名は bin_<bucket_index>
形式で、bucket_index
は 1
から始まります。
例
次の例では、5 つの要素を含む数値式を 3 つのバケットに分割しています。
SELECT f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket FROM UNNEST([1,2,3,4,5]) AS f;
出力は次のようになります。
+---+--------+ | f | bucket | +---+--------+ | 3 | bin_2 | | 5 | bin_3 | | 2 | bin_2 | | 1 | bin_1 | | 4 | bin_3 | +---+--------+
次のステップ
- 特徴の前処理の詳細については、特徴前処理の概要をご覧ください。
- 各モデルタイプでサポートされている SQL ステートメントと関数については、各モデルのエンドツーエンドのユーザー ジャーニーをご覧ください。