Fungsi ML.HASH_BUCKETIZE

Dokumen ini menjelaskan fungsi ML.HASH_BUCKETIZE, yang memungkinkan Anda mengonversi ekspresi string menjadi hash deterministik, lalu mengelompokkannya berdasarkan nilai modular hash tersebut.

Sintaks

ML.HASH_BUCKETIZE(string_expression, hash_bucket_size)

Argumen

ML.HASH_BUCKETIZE menggunakan argumen berikut:

  • string_expression: ekspresi STRING yang akan dikelompokkan.
  • hash_bucket_size: nilai INT64 yang menentukan jumlah bucket yang akan dibuat. Nilai ini harus lebih besar dari atau sama dengan 0. Jika hash_bucket_size sama dengan 0, fungsi tersebut hanya akan meng-hash string tanpa mengelompokkan nilai yang di-hash.

Output

ML.HASH_BUCKETIZE menampilkan nilai INT64 yang mengidentifikasi bucket.

Contoh

Contoh berikut mengelompokkan ekspresi string menjadi tiga bucket:

SELECT
  f, ML.HASH_BUCKETIZE(f, 3) AS bucket
FROM UNNEST(['a', 'b', 'c', 'd']) AS f;

Outputnya terlihat mirip dengan yang berikut ini:

+---+--------+
| f | bucket |
+---+--------+
| a |   0    |
+---+--------+
| b |   1    |
+---+--------+
| c |   1    |
+---+--------+
| d |   2    |
+------------+

Langkah selanjutnya