ML.QUANTILE_BUCKETIZE 関数

このドキュメントでは、連続する数値特徴を分位に基づいてバケットに分割できる ML.QUANTILE_BUCKETIZE 関数について説明します。

TRANSFORMで使用すると、同じ分位が自動的に予測に使用されます。

構文

ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()

引数

ML.QUANTILE_BUCKETIZE は次の引数を取ります。

  • numerical_expression: バケット化する数値式。
  • num_buckets: numerical_expression を分割するバケット数を指定する INT64 値。

出力

ML.QUANTILE_BUCKETIZE はバケットの名前を含む STRING 値を返します。返されたバケット名は bin_<bucket_index> 形式で、bucket_index1 から始まります。

次の例では、5 つの要素を含む数値式を 3 つのバケットに分割しています。

SELECT
  f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket
FROM
  UNNEST([1,2,3,4,5]) AS f;

出力は次のようになります。

+---+--------+
| f | bucket |
+---+--------+
| 3 | bin_2  |
| 5 | bin_3  |
| 2 | bin_2  |
| 1 | bin_1  |
| 4 | bin_3  |
+---+--------+

次のステップ