ML.BUCKETIZE 함수

이 문서에서는 숫자 표현식을 버킷으로 분할할 수 있게 해주는 ML.BUCKETIZE 함수에 대해 설명합니다.

구문

ML.BUCKETIZE(numerical_expression, array_split_points [, exclude_boundaries])

인수

ML.BUCKETIZE는 다음 인수를 사용합니다.

  • numerical_expression: 버킷화할 숫자 표현식입니다.
  • array_split_points: numerical_expression 값을 분할할 지점을 제공하는 숫자 값의 배열입니다. 오름차순으로 숫자 값을 제공합니다. 가능한 버킷 범위는 배열의 상위 및 하위 경계로 결정됩니다. 예를 들어 array_split_points 값이 [1, 2, 3, 4]이면 numerical_expression 값을 버킷화할 수 있는 잠재 버킷이 5개입니다.
  • exclude_boundaries: array_split_points의 상위 및 하위 경계를 사용할지 여부를 결정하는 BOOL 값입니다. TRUE이면 버킷을 만드는 데 경계 값이 사용되지 않습니다. 예를 들어 array_split_points 값이 [1, 2, 3, 4]이고 exclude_boundariesTRUE인 경우 numerical_expression 값을 버킷화할 수 있는 잠재 버킷이 3개입니다. 기본값은 FALSE입니다.

출력

ML.BUCKETIZE는 버킷 이름이 포함된 STRING 값을 반환합니다. 반환된 버킷 이름은 1부터 시작하는 bucket_index가 포함된 bin_<bucket_index> 형식입니다.

예시

다음 예시는 경계를 사용 및 사용하지 않고 숫자 표현식을 버킷화합니다.

SELECT
  ML.BUCKETIZE(2.5, [1, 2, 3]) AS bucket,
  ML.BUCKETIZE(2.5, [1, 2, 3], TRUE) AS bucket_without_boundaries;

결과는 다음과 유사합니다.

+---------+----------------------------+
| bucket  | bucket_without_boundaries  |
+---------+----------------------------+
| bin_3   | bin_2                      |
+---------+----------------------------+

다음 단계