ML.QUANTILE_BUCKETIZE 함수
이 문서에서는 분위수를 기반으로 연속된 숫자 특성을 버킷으로 나눌 수 있는 ML.QUANTILE_BUCKETIZE
함수를 설명합니다.
TRANSFORM
절에서 사용할 경우 동일한 분위수가 자동으로 예측에 사용됩니다.
구문
ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()
인수
ML.QUANTILE_BUCKETIZE
는 다음 인수를 사용합니다.
numerical_expression
: 버킷화할 숫자 표현식입니다.num_buckets
:numerical_expression
을 분할할 버킷 수를 지정하는INT64
값입니다.
출력
ML.QUANTILE_BUCKETIZE
는 버킷 이름이 포함된 STRING
값을 반환합니다. 반환된 버킷 이름은 1
부터 시작하는 bucket_index
가 포함된 bin_<bucket_index>
형식입니다.
예
다음 예시에서는 5개 요소의 숫자 표현식을 3개의 버킷으로 나눕니다.
SELECT f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket FROM UNNEST([1,2,3,4,5]) AS f;
결과는 다음과 유사합니다.
+---+--------+ | f | bucket | +---+--------+ | 3 | bin_2 | | 5 | bin_3 | | 2 | bin_2 | | 1 | bin_1 | | 4 | bin_3 | +---+--------+
다음 단계
- 특성 전처리에 대한 자세한 내용은 특성 전처리 개요를 참조하세요.
- 각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.