ML.QUANTILE_BUCKETIZE 函数
本文档介绍 ML.QUANTILE_BUCKETIZE
函数,此函数可让您根据分位数将连续数值特征拆分为多个分桶。
在 TRANSFORM
子句中使用时,预测中会自动使用相同的分位数。
语法
ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()
参数
ML.QUANTILE_BUCKETIZE
接受以下参数:
numerical_expression
:要进行分桶的数值表达式。num_buckets
:指定numerical_expression
拆分成的分桶数量的INT64
值。
输出
ML.QUANTILE_BUCKETIZE
返回包含分桶名称的 STRING
值。返回的分桶名称采用 bin_<bucket_index>
格式,其中 bucket_index
从 1
开始。
示例
以下示例将包含五个元素的数值表达式拆分为三个分桶:
SELECT f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket FROM UNNEST([1,2,3,4,5]) AS f;
输出类似于以下内容:
+---+--------+ | f | bucket | +---+--------+ | 3 | bin_2 | | 5 | bin_3 | | 2 | bin_2 | | 1 | bin_1 | | 4 | bin_3 | +---+--------+
后续步骤
- 如需了解特征预处理,请参阅特征预处理概览。
- 如需了解每种模型类型支持的 SQL 语句和函数,请参阅每个模型的端到端用户体验历程。