ML.QUANTILE_BUCKETIZE 函数

本文档介绍 ML.QUANTILE_BUCKETIZE 函数,此函数可让您根据分位数将连续数值特征拆分为多个分桶。

TRANSFORM 子句中使用时,预测中会自动使用相同的分位数。

语法

ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()

参数

ML.QUANTILE_BUCKETIZE 接受以下参数:

  • numerical_expression:要进行分桶的数值表达式。
  • num_buckets:指定 numerical_expression 拆分成的分桶数量的 INT64 值。

输出

ML.QUANTILE_BUCKETIZE 返回包含分桶名称的 STRING 值。返回的分桶名称采用 bin_<bucket_index> 格式,其中 bucket_index1 开始。

示例

以下示例将包含五个元素的数值表达式拆分为三个分桶:

SELECT
  f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket
FROM
  UNNEST([1,2,3,4,5]) AS f;

输出类似于以下内容:

+---+--------+
| f | bucket |
+---+--------+
| 3 | bin_2  |
| 5 | bin_3  |
| 2 | bin_2  |
| 1 | bin_1  |
| 4 | bin_3  |
+---+--------+

后续步骤