ML.BUCKETIZE 함수
이 문서에서는 숫자 표현식을 버킷으로 분할할 수 있게 해주는 ML.BUCKETIZE
함수에 대해 설명합니다.
구문
ML.BUCKETIZE(numerical_expression, array_split_points [, exclude_boundaries])
인수
ML.BUCKETIZE
는 다음 인수를 사용합니다.
numerical_expression
: 버킷화할 숫자 표현식입니다.array_split_points
:numerical_expression
값을 분할할 지점을 제공하는 숫자 값의 배열입니다. 오름차순으로 숫자 값을 제공합니다. 가능한 버킷 범위는 배열의 상위 및 하위 경계로 결정됩니다. 예를 들어array_split_points
값이[1, 2, 3, 4]
이면numerical_expression
값을 버킷화할 수 있는 잠재 버킷이 5개입니다.exclude_boundaries
:array_split_points
의 상위 및 하위 경계를 사용할지 여부를 결정하는BOOL
값입니다.TRUE
이면 버킷을 만드는 데 경계 값이 사용되지 않습니다. 예를 들어array_split_points
값이[1, 2, 3, 4]
이고exclude_boundaries
가TRUE
인 경우numerical_expression
값을 버킷화할 수 있는 잠재 버킷이 3개입니다. 기본값은FALSE
입니다.
출력
ML.BUCKETIZE
는 버킷 이름이 포함된 STRING
값을 반환합니다.
반환된 버킷 이름은 1
부터 시작하는 bucket_index
가 포함된 bin_<bucket_index>
형식입니다.
예시
다음 예시는 경계를 사용 및 사용하지 않고 숫자 표현식을 버킷화합니다.
SELECT ML.BUCKETIZE(2.5, [1, 2, 3]) AS bucket, ML.BUCKETIZE(2.5, [1, 2, 3], TRUE) AS bucket_without_boundaries;
결과는 다음과 유사합니다.
+---------+----------------------------+ | bucket | bucket_without_boundaries | +---------+----------------------------+ | bin_3 | bin_2 | +---------+----------------------------+
다음 단계
- 특성 전처리에 대한 자세한 내용은 특성 전처리 개요를 참조하세요.
- 각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.