ML.HASH_BUCKETIZE 함수
이 문서에서는 문자열 표현식을 확정 해시로 변환한 후 해당 해시의 나머지 값으로 버킷화할 수 있는 ML.HASH_BUCKETIZE
함수를 설명합니다.
구문
ML.HASH_BUCKETIZE(string_expression, hash_bucket_size)
인수
ML.HASH_BUCKETIZE
는 다음 인수를 사용합니다.
string_expression
: 버킷화할STRING
표현식입니다.hash_bucket_size
: 만들려는 버킷 수를 지정하는INT64
값입니다. 값은0
보다 크거나 같아야 합니다.hash_bucket_size
가0
이면 함수가 해시 값을 버킷화하지 않고 문자열만 해시합니다.
출력
ML.HASH_BUCKETIZE
는 버킷을 식별하는 INT64
값을 반환합니다.
예
다음 예시는 문자열 표현식을 3개의 버킷으로 버킷화합니다.
SELECT f, ML.HASH_BUCKETIZE(f, 3) AS bucket FROM UNNEST(['a', 'b', 'c', 'd']) AS f;
결과는 다음과 유사합니다.
+---+--------+ | f | bucket | +---+--------+ | a | 0 | +---+--------+ | b | 1 | +---+--------+ | c | 1 | +---+--------+ | d | 2 | +------------+
다음 단계
- 특성 전처리에 대한 자세한 내용은 특성 전처리 개요를 참조하세요.
- 각 모델 유형에 지원되는 SQL 문과 함수에 대한 자세한 내용은 각 모델의 엔드 투 엔드 사용자 경험을 참조하세요.