ML.QUANTILE_BUCKETIZE 함수

이 문서에서는 분위수를 기반으로 연속된 숫자 특성을 버킷으로 나눌 수 있는 ML.QUANTILE_BUCKETIZE 함수를 설명합니다.

TRANSFORM에서 사용할 경우 동일한 분위수가 자동으로 예측에 사용됩니다.

구문

ML.QUANTILE_BUCKETIZE(numerical_expression, num_buckets) OVER()

인수

ML.QUANTILE_BUCKETIZE는 다음 인수를 사용합니다.

  • numerical_expression: 버킷화할 숫자 표현식입니다.
  • num_buckets: numerical_expression을 분할할 버킷 수를 지정하는 INT64 값입니다.

출력

ML.QUANTILE_BUCKETIZE는 버킷 이름이 포함된 STRING 값을 반환합니다. 반환된 버킷 이름은 1부터 시작하는 bucket_index가 포함된 bin_<bucket_index> 형식입니다.

다음 예시에서는 5개 요소의 숫자 표현식을 3개의 버킷으로 나눕니다.

SELECT
  f, ML.QUANTILE_BUCKETIZE(f, 3) OVER() AS bucket
FROM
  UNNEST([1,2,3,4,5]) AS f;

결과는 다음과 유사합니다.

+---+--------+
| f | bucket |
+---+--------+
| 3 | bin_2  |
| 5 | bin_3  |
| 2 | bin_2  |
| 1 | bin_1  |
| 4 | bin_3  |
+---+--------+

다음 단계