ML.HASH_BUCKETIZE 함수

이 문서에서는 문자열 표현식을 확정 해시로 변환한 후 해당 해시의 나머지 값으로 버킷화할 수 있는 ML.HASH_BUCKETIZE 함수를 설명합니다.

구문

ML.HASH_BUCKETIZE(string_expression, hash_bucket_size)

인수

ML.HASH_BUCKETIZE는 다음 인수를 사용합니다.

  • string_expression: 버킷화할 STRING 표현식입니다.
  • hash_bucket_size: 만들려는 버킷 수를 지정하는 INT64 값입니다. 값은 0보다 크거나 같아야 합니다. hash_bucket_size0이면 함수가 해시 값을 버킷화하지 않고 문자열만 해시합니다.

출력

ML.HASH_BUCKETIZE는 버킷을 식별하는 INT64 값을 반환합니다.

다음 예시는 문자열 표현식을 3개의 버킷으로 버킷화합니다.

SELECT
  f, ML.HASH_BUCKETIZE(f, 3) AS bucket
FROM UNNEST(['a', 'b', 'c', 'd']) AS f;

결과는 다음과 유사합니다.

+---+--------+
| f | bucket |
+---+--------+
| a |   0    |
+---+--------+
| b |   1    |
+---+--------+
| c |   1    |
+---+--------+
| d |   2    |
+------------+

다음 단계